• 10 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 22/08/2022

Nettoyer un jeu de données

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Compétences évaluées

  • Nettoyer un jeu de données

Description

Ce quiz va être un peu particulier, car vous allez devoir faire tourner quelques lignes de code sur ce jeu de données et mettre en pratique ce que vous avez appris pour pouvoir y répondre !

Celui-ci concerne les résultats de 340 coureurs ayant réalisé un 10 km, relevés à l'arrivée. Vous trouverez le jeu de données ici. Ce jeu de données contient pour chaque individu :

  • la position à l'arrivée ;
  • son genre ;
  • le temps effectué en heures:minutes:secondes ;
  • son département de résidence ;
  • le temps effectué en secondes ;
  • son âge.
  • Question 1

    Sachant que l'ensemble des coureurs proviennent soit de la Seine-Maritime (76), soit de l'Eure (27) ou soit du Calvados (14), quel département n'appartenant pas à cette liste apparaît pourtant dans notre jeu de données ?

    • 12

    • 00

    • 78

    • 76

  • Question 2

    Notre jeu de données contient plusieurs valeurs manquantes. Déterminez combien exactement et combien de variables sont concernées :

    • 6 valeurs manquantes sur 1 variable

    • 6 valeurs manquantes sur 2 variables

    • 4 valeurs manquantes sur 2 variables

    • 2 valeurs manquantes sur 1 variable

  • Question 3

    Essayez de convertir la variable Temps dans un format adapté (datetime, par exemple). Vous obtiendrez normalement une valeur manquante, après transformation. À quoi est due cette valeur manquante ?

    • Elle était déjà présente avant la conversion

    • Une erreur d'irrégularité

    • Un outlier

    • Un doublon