• 8 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 20/11/2023

Présentez vos données sous la forme de graphiques

Cela fait un petit bout de temps que l’on parle de graphiques, non ? Bonne nouvelle ! C’est dans ce chapitre que vous allez apprendre à les créer !

Créez un diagramme en bâtons

Ici, nous complétons le tableau de bord en créant la visualisation qui nous permet d’analyser l'âge des personnes abonnées en fonction du type d’abonnement souscrit.

Pour cela, on va utiliser un diagramme en barres.

Résumé :

  • Pour le diagramme en barres, il faut placer la dimension “type_abonnement” sur l’axe horizontal et la mesure “âge” sur l’axe vertical. 

  • Il faut également choisir la fonction d’agrégation pour âge : ici, on veut afficher l’âge moyen.

Représentez l’évolution d’une mesure dans le temps

Continuons par l’un des graphiques les plus fréquents, à savoir les courbes qui varient dans le temps !

Résumé :

  • Une série temporelle nécessite de placer le temps sur l’axe horizontal et la (ou les) mesure(s) à afficher sur l’axe vertical.

  • Il faut appliquer une fonction d’agrégation à cette mesure.

Il y a plusieurs manières d’afficher une série temporelle : avec des barres ou avec une courbe. Les barres sont à réserver quand le nombre de dates à afficher est faible :

Série temporelle avec des barres
Série temporelle avec des barres

S’il est, à l'inverse, très important, on utilisera plutôt des courbes :

Série temporelle avec une courbe
Série temporelle avec une courbe

Et quand on est entre les deux, on peut choisir l’un ou l’autre.

Et quand il y a plusieurs séries temporelles à représenter sur le même graphique, on utilise des barres ou des courbes ?

Il y a également les 2 mêmes possibilités, soit des courbes, soit des barres :

Deux séries temporelles représentées avec des barres
Deux séries temporelles représentées avec des barres
Deux séries temporelles représentées avec des courbes
Deux séries temporelles représentées avec des courbes

Attention cependant : au-delà de 2 séries temporelles, la représentation en barres devient très difficile à lire. En effet, si vous voulez observer l’évolution d’une des 3 séries temporelles, votre œil devra observer 1 barre sur 3. Pour vous en rendre compte, essayez d’observer l’évolution de la série représentée en bleu ci-dessous. Pas facile, n’est-ce pas ?

Trois séries temporelles représentées avec des barres
Trois séries temporelles représentées avec des barres

Affichez un diagramme en secteurs

Pour finir, affichons un diagramme en secteurs, plus communément appelé le “camembert”.

Résumé :

  • Nous avons affiché ici la distribution (la répartition) du type d’utilisateurs et d'utilisatrices de nos vélos : avec ou sans abonnement ?

  • Sur un diagramme en secteurs, pas de notion d’axe vertical ou horizontal : on ne remplit donc pas les étagères “Ligne” et “Colonnes”. Il suffit juste de placer la mesure souhaitée dans “couleur” puis de sélectionner le type de graphique : “Secteurs”.

À noter qu’aujourd’hui le camembert n’est plus à la mode, et s’est fait détrôner par le doughnut. Le diagramme en doughnut, c’est la même chose que le camembert mais avec un trou dedans. Je vous montre comment faire dans la vidéo.

Comme alternative au diagramme en secteurs, il existe aussi le “treeplot”, qui permet d’afficher plus d’éléments sur la visualisation :

Représentation graphique de type treeplot
Représentation graphique de type treeplot

Et si je veux représenter l’évolution d’une composition dans le temps ? 

Minute, j’allais y venir ! On utilise dans ce cas des barres empilées ou des surfaces empilées, comme ceci :

Représentation graphique avec des barres empilées
Représentation graphique avec des barres empilées

Si l'on souhaite plutôt étudier ces compositions sous forme de pourcentage, alors la somme des barres (ou surfaces) empilées sera toujours de 100%. Ainsi, on obtient ce type de graphique :

Représentation graphique sous forme de pourcentage avec des barres empilées
Représentation graphique sous forme de pourcentage avec des barres empilées

À vous de jouer

Contexte

C’est le moment de se remettre au travail.

Vous regardez le blueprint pour voir quelles visualisations faire à présent. Les voici :

  • l’âge moyen des personnes par produit ;

  • le nombre d’affichages de bannières au cours du temps.

Consignes

Réalisez ces 2 visualisations :

Visualisation de type barplot à réaliser
Visualisation de type barplot à réaliser
Visualisation de type courbe à réaliser
Visualisation de type courbe à réaliser

Corrigé

Pour afficher la série temporelle, il faut mettre le timestamp sur l’axe horizontal et le nombre d’affichages sur l’axe vertical :

Paramètres à intégrer pour la série temporelle de type courbe
Paramètres à intégrer pour la série temporelle de type courbe

Pour le diagramme en barres, il faut placer les pays dans “Colonnes” et “MOY(Age)” dans “Lignes” :

Paramètres à intégrer pour la série temporelle de type barplot
Paramètres à intégrer pour la série temporelle de type barplot

En résumé

  • Le diagramme en barres s’utilise quand on veut comparer une mesure selon une dimension. L’affichage d’un diagramme en bâtons nécessite une dimension sur un axe et une mesure (agrégée) sur l’autre axe.

  • Le diagramme en secteurs est utilisé pour représenter une composition. L’affichage d’un diagramme en secteurs s’effectue en sélectionnant le type de graphique “secteurs” et en plaçant la mesure choisie dans “couleurs”.           

  • On utilise les séries temporelles pour représenter l’évolution d’une mesure au fil du temps.

L’affichage d’une série temporelle nécessite de placer l’axe du temps sur l’axe horizontal, ainsi qu’une mesure sur l’axe vertical.

Bravo ! Vous savez à présent réaliser la plupart des visualisations basiques. Avec elles, vous pouvez vous en sortir dans n’importe quelle situation. N’importe laquelle ? Non… Il y a une chose que nous n’avons pas encore vu : les cartes géographiques !

Exemple de certificat de réussite
Exemple de certificat de réussite