• 8 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 28/04/2023

Construisez le parcours des données et définissez leur finalité

Découvrez les façons d’améliorer votre pipeline de données

Le pipeline de données de Sarah du chapitre précédent est un bon moyen pour elle de comprendre ce qui est réalisable avec ses données. Mais, peut-on aller encore plus loin ? Pouvez-vous :

  • ajouter de la valeur pour que les informations soient encore plus intéressantes ?

  • identifier des connaissances actionnables?

  • voir ce processus comme un voyage vers une destination pendant lequel les données orientent la prise de décisions?

Définissez un nouvel objectif piloté par les données

À cette étape, vous pouvez poser des questions à Sarah pour clarifier les objectifs en matière de traitement des données.

1. À quels résultats finaux pourrait-elle s’attendre après la collecte et le traitement des données ?

Réfléchissez aux connaissances actionnables que vous voulez extraire à partir des informations. Quels seront les destinataires de cette information ?

 

2. À quelles questions les données doivent-elles répondre pour que le résultat souhaité se produise ?

Écrivez une question à laquelle vous souhaitez apporter une réponse.

 

3. Quelles données supplémentaires doit-elle réunir pour répondre à ces questions ?

La réponse peut être « aucune » ou peut provenir de sources nouvelles ou existantes.

 

Sarah souhaite s’entraîner plus efficacement avec son coach sportif en lui donnant des détails sur son activité pour qu’il les examine. Un objectif piloté par les données pourrait ressembler à cela :

1. À quels résultats finaux pourraient-ils s’attendre après la collecte et le traitement des données ?

Réfléchissez aux connaissances actionnables que vous voulez extraire à partir des informations. Quels seront les destinataires de cette information ?

Travailler avec le coach sportif de Sarah et concevoir un programme de remise en forme.

2. À quelles questions les données doivent-elles répondre pour que le résultat souhaité se produise ?

Écrivez une question à laquelle vous souhaitez apporter une réponse.

Sarah est-elle plus en forme avec son programme d’exercice ?

3. De quelles données supplémentaires a-t-elle besoin pour répondre à ces questions ?

La réponse peut être « aucune » ou peut provenir de sources nouvelles ou existantes.

Jours où elle a fait du vélo.

Les questions et les réponses ci-dessus vous permettent de clarifier la finalité des données. Vous devez utiliser ces réponses pour modifier le pipeline de données. Pensez à chaque question et réponse tour à tour (cette fois-ci, en travaillant à rebours à partir des nouvelles données) :

3. De quelles données supplémentaires a-t-elle besoin pour répondre à ces questions ?

Jours où elle a fait du vélo.

Vous saurez ainsi de quelles sources de données vous avez besoin. Sarah doit enregistrer les jours où elle a fait du vélo. Elle peut consigner ces données de santé dans son journal de bord :

Une image montre le pipeline de données provenant du carnet de santé de Sarah. Les données brutes qui en sont extraites sont les symptômes et les jours où elle a fait du vélo.

2. À quelles questions les données doivent-elles répondre pour que le résultat souhaité se produise ?

Sarah est-elle plus en forme avec son programme d’exercice ?

Vous saurez ainsi de quelles nouvelles informations vous avez besoin. Pour répondre à la question sur la forme physique de Sarah, vous pouvez combiner le nombre de pas et ses sessions de vélo avec sa fréquence cardiaque au repos :

Une image montre le rectangle d'information indiquant

1. À quels résultats finaux pourrait-elle s’attendre après la collecte et le traitement des données ?

Travailler avec le coach sportif de Sarah et concevoir un programme de remise en forme.

Cela vous donne des éléments sur la finalité et sur les connaissances actionnables que vous souhaitez obtenir :

Une image montre le rectangle de destination qui indique

Réfléchissez à votre pipeline de données

Maintenant que vous avez identifié des sources de données spécifiques, des informations et des finalités, ajoutons-les à votre pipeline de données. J’ai retiré les opérations, les informations et les finalités précédentes pour que le schéma reste simple. Elles n’ont pas disparu, mais elles n’ont actuellement pas d’intérêt pour vos objectifs spécifiques :

Une image du pipeline de données pour Sarah sans l'étape Opérations

Comment relier les données brutes de Sarah à ces nouvelles informations ?

Vous pourriez effectuer plusieurs opérations sur les données (vous en découvrirez certaines plus tard dans ce cours). L’une des plus faciles consiste à combiner les données de différentes sources. C’est parti. Combinons des données brutes pour créer le rapport de forme physique :

Une image du pipeline de données pour Sarah sans l'étape Opérations

Pour terminer, vous pouvez suggérer une action pilotée par les données à ajouter au pipeline, même si vous ne savez pas exactement ce que Sarah et son coach sportif vont proposer dans leur programme de remise en forme.

Une photo montre la version achevée du précédent pipeline de données pour Sarah.

À vous de jouer !

 

Vous avez amélioré l’aspect forme physique du pipeline de données de Sarah. Concentrons-nous sur l’aspect santé. Sarah est un peu inquiète à propos de sa santé, notamment à cause de symptômes récurrents. De plus, elle a parfois du mal à se motiver et à avoir de l’énergie le matin. Elle se demande s’il existe une tendance de fond.

Fixez un nouvel objectif basé sur les données pour le compte de Sarah en vous servant du modèle ci-dessous :

1. Quels résultats éventuels est-ce que je souhaite obtenir après la collecte et le traitement des données ?

Réfléchissez aux connaissances actionnables que vous voulez extraire à partir des informations. Quels seront les destinataires de ces informations ?

 

2. À quelles questions doivent répondre ces données ?

Écrivez une question à laquelle vous voulez apporter une réponse.

 

3. De quelles données supplémentaires ai-je besoin pour répondre à ces questions ?

La réponse peut être « aucune » ou peut provenir de sources nouvelles ou existantes.

 

Puis, complétez le pipeline de données pour répondre à ce nouvel objectif.

✅ Vérifiez votre travail : avez-vous réussi ? Vous pouvez télécharger mes réponses ici pour les comparer aux vôtres.

En résumé

Dans ce chapitre, vous avez :

  • fixé les objectifs en créant une destination pour les données où les décisions et les actions sont pilotées par les données ;

  • posé les bonnes questions pour déterminer la destination des données ;

  • utilisé les réponses pour identifier les changements nécessaires à l’amélioration du pipeline de données.

Félicitations ! Vous avez atteint la fin de la première partie de ce cours. J’espère que vous avez conscience du potentiel incroyable de la data ! Dans la partie suivante, nous allons manipuler les données et les transformer en informations utiles.

Exemple de certificat de réussite
Exemple de certificat de réussite