Data

Réalisez une analyse exploratoire de données

Comprenez les tendances de votre jeu de données avec la puissante ACP (Analyse en Composantes Principales) et d'autres méthodes de classification automatique comme le k-means.

Moyenne

15 heures

Ce cours en libre accès vous intéresse ?

Commencer

Vous avez un important volume de données ? Il est important de savoir les synthétiser !

Dans ce cours, vous apprendrez à effectuer une analyse exploratoire multidimensionnelle. Nous utiliserons des méthodes populaires pour analyser rapidement votre échantillon, en réduisant la dimension du nombre d'individus ou de variables.

Nous aborderons des méthodes emblématiques, comme l'analyse en composantes principales ou encore le fameux clustering.

L'analyse en composantes principales (ACP, ou PCA en anglais) permet de dégager rapidement les principales tendances de votre échantillon, en diminuant le nombre de variables nécessaires à la représentation de vos données, tout en perdant le moins d'informations possible.

Nous aborderons également les deux méthodes de clustering les plus populaires : l'algorithme du k-means et la classification hiérarchique. Celles-ci permettent de regrouper vos individus selon leurs similarités.

À la fin de ce cours, vous aurez ajouté à votre boîte à outils les méthodes classiques de tout bon Data Analyst !

Objectifs pédagogiques

Appréhender la notion d'espace vectoriel euclidien
Interpréter une ACP

Et si vous en faisiez votre métier ?

Suivez une des formations diplômantes de notre école 100% en ligne, et transformez vos connaissances en compétences professionnelles.

Formations jusqu’à 100 % financées
Date de début flexible
Projets professionnalisants
Mentorat individuel

Démarrer mon inscription

1/2

DataData AnalystDécouvrez pas à pas le monde de la Data Science : préparez, analysez et modélisez des données.

Diplôme de niveau 6 (bac +3/4)

À plein temps : 12 mois

Table des matières

Partie 1
Découvrez l'analyse exploratoire multidimensionnelle
Partie 2
Découvrez l'analyse en composantes principales (ACP)
Partie 3
Partitionnez vos données

Contributeurs

Professeurs

Benjamin Marlé

Graduated in Big Data from the University of Reims, France. Currently working as a freelance Data Scientist

Nicolas Rangeon

Nicolas Rangeon, Data scientist, instructor & Computer engineer (Université de Technologie de Compiègne)

Créé par

OpenClassrooms

Mis à jour le 23/01/2025

Licence

Data