Il existe de nombreux types de tableaux et de graphiques. Selon l’ensemble de vos données et le type d'information que vous voulez afficher, certains formats conviennent mieux que d'autres. Tout au long de ce chapitre, nous explorerons différents types de graphiques.
Visualisation d'une distribution statistique : les histogrammes
Les histogrammes à barres (aussi appelés diagrammes en colonnes) peuvent avoir des barres horizontales ou verticales et permettent de comparer différentes catégories. La longueur de chaque barre représente la valeur de ce qui est tracé. Chaque diagramme à barres doit avoir une échelle qui commence à zéro pour s'assurer que vous ne manipulez pas les données.
Un diagramme à barres empilées est essentiellement une combinaison de diagrammes à barres et de diagrammes circulaires. C'est une façon d'afficher plusieurs diagrammes circulaires sous forme de colonnes, ce qui est utile lorsque vous regardez une série d'ensembles de données. Une façon de les utiliser est d'afficher l'état d'achèvement de différentes tâches.
Visualisation des proportions : les diagrammes circulaires
Les diagrammes circulaires sont utiles pour représenter des parties d'un tout, où les parties s'additionnent jusqu'à 100 %. Dans Google Analytics, les principales sources de référence (canaux), les nouveaux utilisateurs vs les anciens utilisateurs et les données démographiques selon le sexe sont trois types d'informations qui sont présentés sous forme de diagrammes circulaires pour donner une visualisation rapide de l'information.
Le diagramme en beignet est un diagramme circulaire dont le centre est découpé. Dans un diagramme en beignet, la longueur des arcs devient plus évidente. Dans un diagramme en camembert, la proportion par rapport à l'ensemble est plus importante.
Lorsque vous utilisez des diagrammes circulaires (camemberts) et à beignets, évitez d'avoir trop de segments, car il sera difficile pour le spectateur d'en saisir le sens. Il est préférable d'utiliser une vue à plat. Par ailleurs, les camemberts 3D ont tendance à déformer l'information.
Ce diagramme circulaire en est un exemple de ce qu'il ne faut PAS faire. Il y a tellement de petits fragments d'information qu'il serait préférable de voir s'il existe un moyen de les regrouper dans un titre de catégorie différent.
Visualisation de données temporelles : les graphiques de série temporelle et histogrammes empilés
Le graphique de série temporelle représente l'évolution d'une variable en fonction du temps. C'est la représentation graphique la plus utilisée et son interprétation est généralement très intuitive.
Les graphiques linéaires sont un outil précieux pour montrer la croissance (ou le déclin) de l'entreprise. À travers les pics et les creux, les tendances deviennent plus visibles. Vous pouvez partager plusieurs niveaux d'information sur un graphique, mais essayez de vous limiter à cinq lignes. Au-delà, l’utilisateur aura du mal à comprendre.
Si la série temporelle est simple, il est courant d'utiliser un simple histogramme ou diagramme en bâtons pour la représenter. Par exemple, les données annuelles ou mensuelles sont souvent représentées par des diagrammes en bâtons. En revanche, si les données sont continues, il est plus courant de les représenter par une courbe (line plot) ou un graphique d'aire (area chart).
Les utilisateurs doivent également savoir ce que chaque ligne représente. Ce sont des années différentes ? Différents départements ? Différents pays ? Vous devrez toujours inclure des labels ou des légendes pour que les lecteurs sachent ce qu'ils regardent.
Visualisation de données géolocalisées : les cartes
Une carte statistique permet de représenter la valeur d'une variable statistique dans chacune des unités géographiques d'une entité globale. La carte statistique a l'avantage de pouvoir à la fois révéler une analyse globale tout en permettant à chacun d'aller repérer des détails pour chaque unité géographique.
En revanche, elle a le défaut de donner visuellement à chaque unité géographique une importance proportionnelle à sa superficie alors que, dans de nombreuses situations, il serait préférable que l'importance que l'on donne à chaque unité géographique soit relative à une autre variable (comme sa population).
Visualisation des flux et des arborescences
Lorsque les données ont une structure hiérarchique, elles peuvent être représentées sous la forme d'un dendrogramme ou encore d'un diagramme de flux. Ce dernier est un type de représentation graphique destiné à présenter des données associant des entrées et des sorties figurant des flux.
On peut citer :
le diagramme de flux de données, propre aux systèmes d'information ;
le diagramme de Sankey, utilisé en thermodynamique ;
certaines représentations graphiques de données statistiques, comme la carte figurative de Charles Joseph Minard dont découle le diagramme de Sankey.
Un diagramme de flux de données schématise le flux d'informations de n'importe quel processus ou système. Il utilise des symboles définis comme des rectangles, des cercles et des flèches, ainsi que des étiquettes aux libellés courts, pour représenter les entrées de données, les sorties, les points de stockage et les trajets entre chaque destination.
On peut les utiliser pour analyser un système existant ou en modéliser un nouveau. Comme tous les diagrammes et graphiques de qualité, un diagramme de flux de données peut souvent « dire » visuellement des choses qui seraient difficiles à expliquer avec des mots. Ils sont adaptés aussi bien à des publics techniques et non techniques, du développeur au directeur général. C'est pour cette raison que les diagrammes de flux de données restent aussi prisés après toutes ces années. Même s'ils fonctionnent bien pour les logiciels et les systèmes de flux de données, ils sont moins applicables de nos jours à la visualisation de systèmes ou logiciels interactifs, car les schémas sont plus mouvants.
Les autres types de graphiques
Le type de graphique que vous choisissez doit être pertinent avec l'histoire que vous racontez, tout en rendant les données visibles. Rappelez-vous que les données sont là pour raconter cette histoire, elles appuient votre projet. Vous devez les laisser faire leur travail.
Les nuages de points
Le nuage de points est couramment utilisé pour représenter la relation entre deux variables. Dans un nuage de points, ce sont les coordonnées de chaque point sur l'axe des abscisses et l'axe des ordonnées qui représentent les valeurs de chacune des variables. Il permet de mettre en évidence une corrélation entre deux variables.
Les boîtes à moustaches
Le diagramme en boîte à moustaches résume seulement quelques caractéristiques de position du caractère étudié (médiane, quartiles, min/max ou déciles). Il est utilisé principalement pour comparer un même caractère dans deux populations de tailles différentes. Il s'agit de tracer un rectangle allant du premier quartile au troisième quartile et coupé par la médiane. On ajoute parfois des segments aux extrémités menant jusqu'aux valeurs min/max ou jusqu'au premier et neuvième décile. On parle alors de diagramme en boîte à moustaches ou à pattes.
Les treemaps
La treemap est une représentation visuelle inventée par Ben Shneiderman en 1990 pour représenter l'occupation de l'espace sur son disque dur. Dans cette représentation, c'est la surface de chaque rectangle qui représente la part de chaque élément dans le tout, c’est-à-dire une représentation de données hiérarchiques dans un espace limité. Elle est par exemple utilisée pour représenter l'occupation du disque dur sur un ordinateur. De nos jours, elle est aussi utilisée pour visualiser le budget d'un État.
Synthétisez !
Cole Nussbaumer Knaflic partage des conseils pour créer des graphiques de données efficaces dans son livre "Storytelling with Data." Son approche implique une réflexion critique sur les données (également sur le public et le contexte), ainsi qu'une simplification ou un désencombrement des graphiques de données.
Il propose 5 étapes pour désencombrer un graphique de données :
Tirer parti de la façon dont les gens voient les choses
Employer l'ordre visuel
Créer un contraste net
Dépouillez et bâtissez
Ne compliquez pas trop les choses
Résumons !
Sélectionnez le type de graphique que vous utilisez en fonction des objectifs de votre représentation visuelle.
La simplicité est la meilleure façon de déterminer les types de graphiques (plats, pas en 3D !).
Prenez conscience de l’importance de vos légendes et de leur emplacement afin de communiquer l'information au lecteur.
Les diagrammes à barres sont le type de graphique le plus courant que vous utiliserez pour représenter graphiquement les résultats des usability testings.