Posez-vous les bonnes questions
Vous avez importé les données de Jeanne. Super !
Mais maintenant, si on prend quelques minutes pour observer les données rapidement et la première visualisation que l'on a réalisée, certaines questions peuvent émerger…
La table des situations familiales des emprunteurs fournie par Jeanne contient des données personnelles, c'est normal ?
Non, en effet ! Il nous faut supprimer ces colonnes dans le classeur car nous n’en avons pas besoin.
J'en parlerai à Jeanne et je lui rappellerai de prévenir le délégué à la protection des données du Crédit Breton.
Par ailleurs, dans le chapitre précédent nous avons choisi un graphique en secteurs pour visualiser les montants des opérations immobilières reçues par le Crédit Breton.
Mais le choix du graphique en camembert est-il judicieux ?
Pas vraiment…
Avec un graphique en secteurs, nous avons pu visualiser la distribution des prêts par leurs montants.
Vous ne savez pas comment changer de visualisation ? Eh bien faisons-le ensemble !
Sélectionnez votre graphique et cliquez sur la visualisation d’histogramme dans la zone des visualisations. Votre graphique en secteurs est remplacé instantanément par un histogramme empilé.
Ajoutez maintenant la dimension Accord dans le champ de données “Légende”. Vous verrez que dans votre graphique, vous avez désormais les montants des opérations immobilières reçues par le Crédit Breton par année ET les montants accordés ou refusés.
Quoi : Quelles sont les données que votre utilisateur souhaite visualiser ?
En fonction de celles-ci, vous ne vous choisirez pas le même type de visualisation.
Pourquoi : Pourquoi votre utilisateur souhaite visualiser ces données ?
Cette question a une incidence forte sur le choix de la visualisation et l'interaction que vous devez mettre en place. Souhaite-il identifier une tendance ? des corrélations entre des variables ? rechercher une valeur particulière ?
Comment : Enfin, demandez-vous comment présenter les données à votre utilisateur.
Souhaite-t-il les afficher triées ? filtrées ?
Souhaite-t-il afficher tous les points de données, ou les agréger dans des groupes de valeurs ?
Repérez les pièges d’une mauvaise représentation des données
Le site web WTF visualizations recense de nombreux exemples d'erreurs induites par une visualisation trompeuse. Parmi ceux que j'ai pu trouver, je vous ai sélectionné des cas typiques de mauvaises visualisations :
Graphique en secteurs (camembert)
Dans cet exemple, nous avons l’impression que les résultats de ce sondage au Nebraska sont pour la légalisation de la marijuana. Or, les chiffres nous indiquent le contraire...
Graphique en courbes
Dans l'exemple ci-dessous, le parti conservateur norvégien nous montre que les émissions de CO² ont diminué depuis son arrivée au pouvoir en 2013. Cependant, les années 2014 et 2016 ne sont pas représentées. Lors de ces années, les émissions n’avaient pas baissé...
Histogramme
Dans cet exemple, le parti indien au pouvoir nous montre qu’après deux fortes hausses du prix du pétrole (+20 % et +75 %), ils ont contenu la dernière hausse à +13 %. Cependant cela reste une hausse ! Le graphique laisse penser que le prix du pétrole a baissé presque de moitié, ce qui n’est pas le cas.
À vous de jouer !
Le Crédit Breton souhaite se positionner comme partenaire privilégié des projets immobiliers des cadres et professions intermédiaires. Il souhaite vérifier que sur les dernières années, ce positionnement se vérifie dans les faits par une part grandissante de demandes de prêt reçues de ces catégories professionnelles (User Story 6) :
User Story 6 : En tant que directeur d'agence, je veux pouvoir analyser la composition de mon portefeuille de prêts par catégorie socioprofessionnelle, pour suivre si notre positionnement est le bon.
Répondez aux questions suivantes
Question 1 : Quelles sont les données utiles pour réaliser cette visualisation parmi celles que vous avez ?
Données des agences.
Données des apports personnels.
Données des demandes de prêt.
Données des situations de famille.
Données des situations professionnelles.
Question 2 : Quel est le graphique le plus adapté pour cette visualisation ?
Graphique en secteurs.
Graphique en nuage de points.
Histogramme.
Graphique en courbes.
Map.
Découvrez le résultat
Pour la question 1
Les bonnes réponses sont 3 et 5, car les données dont nous avons besoin sont les dates de demandes de prêt, leurs montants, et la catégorie socioprofessionnelle des clients.
Pour la question 2
La bonne réponse est la réponse 4, le graphique en courbes est le plus adapté pour visualiser cette évolution.
Pour vous en convaincre, vous pouvez reproduire le graphique ci-dessous et cliquer sur d’autres visualisations, comme le graphique en secteurs ou l’histogramme. Vous verrez qu’ils sont soit illisibles (graphique en secteurs), soit plus difficilement accessibles pour comprendre quel est le montant des demandes de prêt reçues annuellement par catégorie.
Exemple avec un graphique en secteurs :
Exemple avec un histogramme :
En résumé
Choisissez une visualisation à partir des données que vous avez à votre disposition.
Interrogez-vous ensuite sur le besoin de votre utilisateur final : Souhaite-t-il identifier une tendance ? des corrélations entre des variables ? rechercher une valeur particulière, et pourquoi ?
Enfin, demandez-vous comment présenter les données à votre utilisateur : Souhaite-t-il les avoir triées ? filtrées ? voir tous les points de données ou les agréger dans des groupes de valeurs ?
Sachez repérer les pièges d’une mauvaise visualisation, comme l’absence de légende, des proportions non respectées ou des données manquantes.
Dans le chapitre suivant, nous allons voir quelles options de visualisation sont disponibles avec Power BI, et comment faire des choix adaptés à vos problématiques !