• 8 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 24/11/2021

Les outils d'analyse : les technologies, leurs avantages et inconvénients

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Dans le chapitre précédent, nous avons vu comment choisir les bons outils d'analyse des réseaux sociaux en fonction de nos objectifs et de leurs fonctionnalités.

Mais savez-vous quelles technologies se cachent derrière ces outils ? Découvrons-le ensemble ! :magicien:

Vous vous souvenez de la définition de social media analytics ? 

 The art and science of extracting valuable hidden insights from vast amounts of semistructured and unstructured social media data to enable informed and insightful decision making.

En français, ça donnerait la définition suivante :

L'art et la science d'extraire des informations à partir d'une grande quantité de données de médias sociaux semi-structurées et non structurées permettant une prise de décision informée. 

Le schéma pour comprendre le social media analytics est donc plutôt simple et se divise en deux grandes catégories: la collecte des données et l'analyse de ces données

La collecte de données ou le scraping

L'accès aux données

L'accès aux données a lieu de trois manières différentes:

  • Via des répertoires où les données peuvent être téléchargées gratuitement (Wikimedia).

  • Via des outils (Google pour le côté gratuit et DataSift pour le côté payant).

  • Via des APIs. API est l'acronyme pour Applications Programming Interface et représente une interface sur laquelle une application peut se brancher afin d'échanger des données (Twitter, Facebook ou encore Wikipedia).

Parmi les réseaux sociaux, il y en a qui n'ont pas encore rendu leurs données libres d'accès. C'est le cas de LinkedIn. Cela crée une barrière surtout dans le domaine du marketing B2B (Business To Business) où LinkedIn est un réseau social très populaire.

Les types de données

Il y a deux types majeurs de données. Les données historiques et les données générées en temps réel. Par exemple, si votre entreprise lance un produit, il vous sera intéressant d'analyser les données en temps réel et non les données historiques. 

S'ajoute une subdivision qui différencie les données brutes (qui proviennent directement de la source et qui n'ont pas été analysées) des données nettoyées (qui ont été corrigées, répertoriées).

L'analyse de données

L'analyse de données peut être soit quantitative soit qualitative. L'analyse quantitative c'est l'analyse chiffrée des données (nombre de "likes", de clics, de followers etc.) alors que l'analyse qualitative représente l'analyse des sentiments liés au contenu produit. Cette analyse des sentiments est une caractéristique présente dans beaucoup d'outils d'analyse des réseaux sociaux car il est très utile pour les marques. Cela permet d'en extraire une opinion autour de la marque ou d'un produit. C'est d'ailleurs ce type d'analyse et de technologies qui différencie le plus les outils les uns des autres et bien comprendre comment sont catégorisées ces données est crucial afin de fournir un travail d'analyse précis et non faussé. 

Les technologies se sont succédées et sont devenues de plus en plus précises :

L'analyse de texte

C'est l'analyse de marqueurs textuels permettant la classification d'une phrase comme étant soit positive soit négative.

Technique utile qui a cependant des limites puisqu'elle n'analyse pas l'intensité et ne prend pas en compte les nuances.

Le machine learning

C'est le fait d'apprendre à l'outil ce qui est négatif et positif. Un humain analysera donc une série de phrases et apprendra à la machine à généraliser et traiter un vaste nombre d'opinions de manière qualitative.

L'avantage c'est que la contribution initiale (l'input) est faite par l'humain. Elle est donc précise et correcte. La limite de cette technique est sans doute le résultat (l'output). Puisqu'il provient de la machine, il n'est pas toujours très adéquate. Généraliser les subtilités de la langue à travers une série de phrases peut se révéler imprécis. 

Le NLP (Natural Language Processing)

Le traitement automatique du langage naturel est la technologie la plus avancée vis-à-vis de l'analyse des sentiments.

Elle permet le traitement d'un grand nombre de corpus de textes afin d'en extraire des probabilités et des  règles de langage pour l'analyse de contenu. En plus de différencier le positif du négatif, cette technologie permet de distinguer l'intensité d'un propos.

L'inconvénient : ça coûte cher ! Cette technologie est à la frontière de la linguistique, l'informatique et l'intelligence artificielle. Elle demande donc beaucoup de ressources... très coûteuses !

En résumé

Dans ce chapitre nous avons:

  • Fait la différence entre la collecte et l'analyse de données.

  • Vu que les données peuvent être obtenues via des téléchargements, des outils ou des APIs.

  • Différencié les données historiques des données en temps réel ainsi que les données brutes des données nettoyées. 

  • Enuméré les différentes technologies d'analyse des sentiments avec le NLP étant la technologie la plus avancée mais aussi la plus coûteuse.

Exemple de certificat de réussite
Exemple de certificat de réussite