Rencontrez Emeric Nicolas, Data Scientist

En résumé 

  • L’ACP, ou analyse en composante principale, permet de créer des dimensions « synthétiques » qui regroupent plusieurs dimensions en une seule.

  • On peut ainsi passer d'un dataframe à 30 colonnes à un dataframe à 3 colonnes, ce qui facilite grandement l'analyse.

  • Quand on veut travailler sur les groupes d'individus, on fait du clustering. Les algorithmes les plus connus sont le k-means et la CAH (classification ascendante hiérarchique).

  • Cela permet de regrouper des individus au sein de groupes spécifiques et homogènes.

  • On peut alors isoler certains groupes, et travailler plus en détail sur leurs individus propres.

Ever considered an OpenClassrooms diploma?
  • Up to 100% of your training program funded
  • Flexible start date
  • Career-focused projects
  • Individual mentoring
Find the training program and funding option that suits you best