Découvrez l'organisation du cours
Ce cours est-il long ?
Même si les chapitres sont nombreux, ils sont relativement courts.
Allez, disons-le : dès que l'on arrive sur la page d'un chapitre, on le déroule jusqu'en bas pour voir s'il est long ou pas. Ne vous laissez pas décourager, car certains chapitres paraissent longs, mais ils ne le sont en fait pas !
De plus, les chapitres sont assez variés. Vous trouverez :
14 chapitres sur la théorie des statistiques descriptives, et comment l'appliquer en Python et en R ;
5 chapitres de contextualisation : de la culture générale sur les statistiques.
À vous de jouer
Vous apprendrez à nettoyer et analyser un jeu de données. Il y aura des chapitres plutôt théoriques, sur la théorie des statistiques, et des sections À vous de jouer qui vous proposeront des exercices dans certains chapitres. Elles vous invitent à appliquer les statistiques en langage R ou en Python.
Tout au long de ce cours, je vous propose de vous entraîner sur 2 jeux de données :
Un petit jeu de données plein d'erreurs, qu'il vous faudra nettoyer. Il nous occupera durant 1 partie.
Un jeu de données de relevés bancaires, qui nous accompagnera pour l'ensemble de ce cours
Est-ce que ce sera fun ?
Je l'espère ! Ce cours vous fera analyser des données issues d'un compte bancaire. Si vous le souhaitez, vous pouvez reproduire ces opérations et analyses sur... vos propres relevés ! Mais les données que nous utiliserons dans le cadre de ce cours sont dans ce fichier operations.csv. Nous répondrons à certaines questions telles que :
Quand vous faites vos courses, à quelle vitesse consommez-vous vos produits ?
Combien faites-vous de stock ?
Consommez-vous plus en début ou en fin de mois ? Les week-ends ?
Êtes-vous plus dépensier lorsque vous avez beaucoup d'argent sur votre compte ?
etc.
Appréhendez les conditions de succès
Pour obtenir le certificat de cours, vous devrez passer et réussir les quiz et les activités de fin de partie (il y en a 4 au total). Je vous conseille très fortement de vous entraîner sur le code R ou Python, en fonction de votre préférence.
Faites votre choix : Python ou R ?
Python et R sont les deux langages les plus utilisés en analyse de données.
Ce cours est plus orienté vers Python, car les chapitres sont illustrés dans ce langage. Mais si vous préférez R, sachez que tout le code Python de ce cours est traduit en R, vous n'aurez donc aucun mal à suivre ! Les deux notebooks comprenant le code utilisé et l'ensemble des corrections des différents exercices se trouvent dans le dossier ci dessus.
Si vous n'en maîtrisez aucun, vous aurez du mal à suivre ce cours, à moins que vous ne souhaitiez consulter que les parties théoriques.