Vous avez un important volume de données ? Il est important de savoir les synthétiser !
Dans ce cours, vous apprendrez à effectuer une analyse exploratoire multidimensionnelle. Nous utiliserons des méthodes populaires pour analyser rapidement votre échantillon, en réduisant la dimension du nombre d'individus ou de variables.
Nous aborderons des méthodes emblématiques, comme l'analyse en composantes principales ou encore le fameux clustering.
L'analyse en composantes principales (ACP, ou PCA en anglais) permet de dégager rapidement les principales tendances de votre échantillon, en diminuant le nombre de variables nécessaires à la représentation de vos données, tout en perdant le moins d'informations possible.
Nous aborderons également les deux méthodes de clustering les plus populaires : l'algorithme du k-means et la classification hiérarchique. Celles-ci permettent de regrouper vos individus selon leurs similarités.
À la fin de ce cours, vous aurez ajouté à votre boîte à outils les méthodes classiques de tout bon Data Analyst !