En résumé
L’ACP, ou analyse en composante principale, permet de créer des dimensions « synthétiques » qui regroupent plusieurs dimensions en une seule.
On peut ainsi passer d'un dataframe à 30 colonnes à un dataframe à 3 colonnes, ce qui facilite grandement l'analyse.
Quand on veut travailler sur les groupes d'individus, on fait du clustering. Les algorithmes les plus connus sont le k-means et la CAH (classification ascendante hiérarchique).
Cela permet de regrouper des individus au sein de groupes spécifiques et homogènes.
On peut alors isoler certains groupes, et travailler plus en détail sur leurs individus propres.