- 10 hours
- Easy
Free online content available in this course.
course.header.alt.is_video
course.header.alt.is_certifying
Got it!Last updated on 9/13/24
Nettoyer un jeu de données
Evaluated skills
- Nettoyer un jeu de données
Description
Ce quiz va être un peu particulier, car vous allez devoir faire tourner quelques lignes de code sur ce jeu de données et mettre en pratique ce que vous avez appris pour pouvoir y répondre !
Celui-ci concerne les résultats de 340 coureurs ayant réalisé un 10 km, relevés à l'arrivée. Vous trouverez le jeu de données ici. Ce jeu de données contient pour chaque individu :
- la position à l'arrivée ;
- son genre ;
- le temps effectué en heures:minutes:secondes ;
- son département de résidence ;
- le temps effectué en secondes ;
- son âge.
Question 1
Sachant que l'ensemble des coureurs proviennent soit de la Seine-Maritime (76), soit de l'Eure (27) ou soit du Calvados (14), quel département n'appartenant pas à cette liste apparaît pourtant dans notre jeu de données ?
12
00
78
76
Question 2
Notre jeu de données contient plusieurs valeurs manquantes. Déterminez combien exactement et combien de variables sont concernées :
6 valeurs manquantes sur 1 variable
6 valeurs manquantes sur 2 variables
4 valeurs manquantes sur 2 variables
2 valeurs manquantes sur 1 variable
Question 3
Essayez de convertir la variable Temps dans un format adapté (datetime, par exemple). Vous obtiendrez normalement une valeur manquante, après transformation. À quoi est due cette valeur manquante ?
Elle était déjà présente avant la conversion
Une erreur d'irrégularité
Un outlier
Un doublon
- Up to 100% of your training program funded
- Flexible start date
- Career-focused projects
- Individual mentoring