OpenClassrooms devient une université américaine accréditée.
Découvrez ce que cela change pour vousTable des matières
- Partie 1
Découvrez l'analyse exploratoire multidimensionnelle
Êtes-vous prêt à suivre ce cours ?
Découvrez l'intérêt de l’analyse multidimensionnelle
Rencontrez Emeric Nicolas, Data Scientist
Découvrez les méthodes factorielles et la classification non supervisée
Téléchargez les jeux de données analysés dans ce cours
Représentez vos données dans un espace
Quiz : Avez-vous compris l'intérêt de l'analyse exploratoire multidimensionnelle ?
- Partie 2
Découvrez l'analyse en composantes principales (ACP)
Comprenez l'enjeu de l'analyse en composantes principales
Découvrez les espaces que nous utiliserons
Interprétez le cercle des corrélations
Représentez les individus sur les plans factoriels
Choisissez le nombre de composantes
TP : Réalisez une ACP
Soyez attentif aux spécificités de l'ACP
Quiz : Pratiquez l'ACP
- Partie 3
Partitionnez vos données
TP : Réalisez une ACP
C'est le moment de plonger dans le code !
Nous allons ici analyser les jeux de données que nous avons détaillés dans un précédent chapitre.
#Les cours OpenClassrooms
Dans les précédents chapitres, nous avons illustré le cercle des corrélations et la projection des individus à l'aide du jeu de données des cours OpenClassrooms que j'ai suivis (que vous pouvez aussi télécharger au chapitre dédié).
Vous pouvez travailler directement depuis Google Colab, ou depuis un Jupyter Notebook sur votre machine.
Une fois ce travail terminé, je vous invite à relire rapidement les chapitres précédents. Il seront peut-être plus clairs pour certains .
#Le jeu de données mystère
C'est maintenant le moment de découvrir ce que représente l'échantillon mystère.
Mais cette fois, nous allons changer un peu de configuration... En effet, j'ai, par erreur bien sûr, supprimé des lignes dans mon notebook. Pourriez-vous m'aider à les réécrire ?
Vous pouvez travailler directement depuis Google Colab, ou depuis un Jupyter Notebook sur votre machine.
C'est étrange de travailler sur ce type de dataset, non ?
Oui, et non !
En effet, dans cet échantillon, chaque individu est un point du chat et bien entendu, vous aurez rarement un échantillon statistique où les points seront disposés selon la forme d'un animal ou d'un objet.
Cet échantillon se rapproche plutôt de ce qu'utilisent les personnes qui pratiquent la modélisation 3D (architectes, vidéastes, ingénieurs en mécanique, physiciens, etc.). Mais, depuis le début, nous avons souvent fait le parallèle entre nos nuages de points de statisticiens et l'inertie des objets réels qu'étudient les physiciens.
Et donc ?
Quand vous projetez et visualisez vos données sur F1 et F2, vous faites une projection orthogonale en 2D d'un objet en 3D.
Les 2 graphiques de dispersion que je vous avais donnés dans ce chapitre étaient aussi des projections 2D de points en 3D. Cependant, sur ceux-ci, nous n'arrivions pas à distinguer la forme du chat. Pourquoi ?
Parce que l'ACP a trouvé la meilleure projection : celle qui montre la plus grande inertie.
Autrement dit, si vous voulez prendre une photo de votre chat, le meilleur angle pour avoir le plus de détails possible sera donc de profil, comme vous le voyez ci-dessus .
- Formations jusqu’à 100 % financées
- Date de début flexible
- Projets professionnalisants
- Mentorat individuel