Data
Réalisez une analyse exploratoire de données
Vous avez un important volume de données ? Il est important de savoir les synthétiser !
Dans ce cours, vous apprendrez à effectuer une analyse exploratoire multidimensionnelle. Nous utiliserons des méthodes populaires pour analyser rapidement votre échantillon, en réduisant la dimension du nombre d'individus ou de variables.
Nous aborderons des méthodes emblématiques, comme l'analyse en composantes principales ou encore le fameux clustering.
L'analyse en composantes principales (ACP, ou PCA en anglais) permet de dégager rapidement les principales tendances de votre échantillon, en diminuant le nombre de variables nécessaires à la représentation de vos données, tout en perdant le moins d'informations possible.
Nous aborderons également les deux méthodes de clustering les plus populaires : l'algorithme du k-means et la classification hiérarchique. Celles-ci permettent de regrouper vos individus selon leurs similarités.
À la fin de ce cours, vous aurez ajouté à votre boîte à outils les méthodes classiques de tout bon Data Analyst !
Objectifs pédagogiques
- Appréhender la notion d'espace vectoriel euclidien
- Interpréter une ACP
Et si vous en faisiez votre métier ?
Suivez une des formations diplômantes de notre école 100% en ligne, et transformez vos connaissances en compétences professionnelles.
- Formations jusqu’à 100 % financées
- Date de début flexible
- Projets professionnalisants
- Mentorat individuel
1/4
Table des matières
- Partie 1
Découvrez l'analyse exploratoire multidimensionnelle
- 1
Êtes-vous prêt à suivre ce cours ?
- 2
Découvrez l'intérêt de l’analyse multidimensionnelle
- 3
Rencontrez Emeric Nicolas, Data Scientist
- 4
Découvrez les méthodes factorielles et la classification non supervisée
- 5
Téléchargez les jeux de données analysés dans ce cours
- 6
Représentez vos données dans un espace
Quiz : Avez-vous compris l'intérêt de l'analyse exploratoire multidimensionnelle ?
- Partie 2
Découvrez l'analyse en composantes principales (ACP)
- 1
Comprenez l'enjeu de l'analyse en composantes principales
- 2
Découvrez les espaces que nous utiliserons
- 3
Interprétez le cercle des corrélations
- 4
Représentez les individus sur les plans factoriels
- 5
Choisissez le nombre de composantes
- 6
TP : Réalisez une ACP
- 7
Soyez attentif aux spécificités de l'ACP
Quiz : Pratiquez l'ACP
- Partie 3
Partitionnez vos données