Introduction du cours
Bienvenue dans ce cours consacré au nettoyage et à l'analyse de données avec R
Dans la première partie du cours, vous découvrirez comment préparer et nettoyer vos données tout en constituant le blueprint indispensable pour mener des analyses pertinentes et utiles.
Dans la seconde partie, vous menerez vos premières analyses univariées, c'est-à-dire, l'analyse d'une variable à la fois.
Enfin, dans la dernière partie du cours, vous conduirez des analyses bivariées, plus complexes, où vous croiserez deux variables pour approfondir la compréhension de vos données.
Rencontrez votre professeur
Découvrez le fonctionnement du cours
Connaissez-vous le principe d'un cours en ligne sur OpenClassrooms ?
Ce cours suit une progression logique que l'on a séquencée en 3 parties. Chaque partie contient plusieurs chapitres, qu'il est préférable de suivre dans l'ordre.
Avant de démarrer, voici quelques conseils pour exploiter au mieux le contenu de ce cours et optimiser votre apprentissage :
Lisez le texte dans chaque chapitre pour comprendre pourquoi les concepts abordés sont importants.
Suivez les activités dans les “À vous de jouer” pour savoir comment vous pouvez mettre en œuvre ces concepts.
Profitez de chaque occasion de pratiquer en faisant une pause dans le cours, pour vous entraîner de votre côté et reproduire pas à pas ce que vous avez lu dans le cours !
Découvrez le projet fil rouge du cours
À la suite de votre formation de data analyst, vous êtes recruté comme data analyst junior par l’entreprise “A tout chemin” qui propose des itinéraires de randonnée et des commodités à proximité sur la France entière. Vos clients peuvent ainsi réserver logements et restaurants proches de leurs randonnées.
Associé à l’antenne de la métropole, vous collaborez avec quelques personnes sur place mais beaucoup en distanciel, dont trois personnes dans les Antilles françaises.
Votre mission principale est d’enrichir la page de chaque département avec un “point météo” sur les températures enregistrées les années passées, afin d'informer au mieux les personnes utilisant le site web.
Pour ce faire, votre cheffe Camille a déjà rassemblé les données nécessaires :
Les températures quotidiennes départementales (depuis janvier 2018 jusqu’à décembre 2023).
La densité d’habitants par kilomètre carré au 1er janvier 2020.
Le nom du chef-lieu de chaque département et ses coordonnées géographiques obtenues via OpenStreetMap.
Il ne vous reste plus qu’à vous lancer dans la visualisation des données !
En fait non, pas tout à fait, vous devez commencer par récolter et analyser les besoins et c'est ce que vous verrez dans le prochain chapitre du cours !
Téléchargez la fiche résumé du cours
Rendez-vous dans le chapitre suivant pour débuter l'analyse des besoins !