Data

Nettoyez et analysez votre jeu de données

Prêt à entrer dans l'univers de la statistique descriptive ? Après ce cours, vous serez capable de nettoyer et décrire un jeu de données.

Facile

10 heures

Ce cours en libre accès vous intéresse ?

Commencer

Quel est le point commun entre un biologiste, un journaliste et un analyste marketing ? Ils communiquent tous à l’aide de graphiques, de moyennes ou de pourcentages ; bref : ils font des statistiques !

Avoir des données à disposition, c'est bien, mais savoir en tirer les informations principales, c'est essentiel. Les données sont l'or noir de notre époque : on en analyse des quantités astronomiques chaque seconde dans le monde grâce à des algorithmes. Vous avez probablement déjà entendu parler de Big Data ou de Data Science.

Dans ce cours, vous apprendrez les bases de la Data Analyse : chercher les informations essentielles dans des données, notamment à l'aide de graphiques. Vous avez déjà entendu parler de moyennes, de variances ou d’histogrammes. Nous allons ici redécouvrir tous ces concepts, mais nous irons encore plus loin en recherchant les relations qui existent à l’intérieur de vos données. Mais avant tout, nous verrons comment nettoyer des données : vous verrez en effet que vos données ne seront jamais directement exploitables sans une phase préalable.

Si vous souhaitez vous lancer dans la Data, ce cours présente les bases essentielles : il est un très bon point de départ. Si vous êtes un simple curieux, ce cours vous conviendra également.

Quel que soit votre jeu de données, il a forcément quelque chose à vous dire !

Ce cours fait partie intégrante du parcours Data Analyst. Il comporte aussi des compétences pour la formation Data Scientist.

Objectifs pédagogiques

Appréhender les bases de l'analyse statistique
Nettoyer un jeu de données
Représenter vos variables
Réaliser une analyse bivariée

Prérequis

Pré-requis :

Mathématiques de niveau Terminale ES ou S
Optionnellement, savoir programmer :
- en langage R (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous au langage R pour analyser vos données")
- ou en langage Python, niveau basique (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous à Python pour l’analyse de données")
Savoir manipuler les objets Dataframe (disponibles nativement sous R, ou en Python via la librairie Pandas) (si ce n'est pas le cas, je vous invite à suivre le cours "Découvrez les librairies Python pour la data science")

Cela vous sera utile pour quelques quiz et activités.

Outils nécessaires :

R ou Python téléchargé sur votre ordinateur.
Les données utilisées dans ce cours.

Et si vous en faisiez votre métier ?

Suivez une des formations diplômantes de notre école 100% en ligne, et transformez vos connaissances en compétences professionnelles.

Formations jusqu’à 100 % financées
Date de début flexible
Projets professionnalisants
Mentorat individuel

Démarrer mon inscription

1/6

DataBusiness Intelligence AnalystCréez des outils d’analyse et facilitez la prise de décision en entreprise

Diplôme de niveau 6 (bac +3/4)

À plein temps : 9 mois

Table des matières

Partie 1
Appréhendez les bases de l'analyse statistique
Partie 2
Nettoyez un jeu de données
Partie 3
Représentez vos variables
Partie 4
Réalisez une analyse bivariée

Contributeurs

Professeurs

Benjamin Marlé

Graduated in Big Data from the University of Reims, France. Currently working as a freelance Data Scientist

Nicolas Rangeon

Nicolas Rangeon, Data scientist, instructor & Computer engineer (Université de Technologie de Compiègne)

Créé par

OpenClassrooms

Mis à jour le 09/09/2025

Licence

Data