• 15 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 18/02/2020

Tirez parti de ce cours

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

L'organisation du cours

Ce cours est-il long ?

Même si les chapitres sont nombreux, ils sont relativement courts.

Allez, disons-le : dès que l'on arrive sur la page d'un chapitre, on le déroule jusqu'en bas pour voir s'il est long ou pas. Ne vous laissez pas décourager, car certains chapitres contiennent beaucoup de parties optionnelles (appelées Aller plus loin) et paraissent donc longs, mais ils ne le sont en fait pas !

De plus, les chapitres sont assez variés. Vous trouverez :

  • 2 chapitres contenant des interviews de Data Analysts (analystes de données)

  • 14 chapitres sur la théorie des statistiques descriptives, et comment l'appliquer en Python et en R

  • 5 chapitres de contextualisation : de la culture générale sur les statistiques

  • 2 chapitres "fiches techniques" : détaillant comment installer R ou Python, et comment préparer vos données

Qu'allez-vous faire dans ce cours ?

Vous apprendrez à analyser un jeu de données (parties 1 à 3) puis à le nettoyer (partie 4). Il y aura des chapitres plutôt théoriques, sur la théorie des statistiques, et des chapitres pratiques. Ces derniers vous invitent à appliquer les statistiques en langage R ou en Python.

Tout au long de ce cours, je vous propose de vous entraîner sur 2 jeux de données :

  1. Un jeu de données de relevés bancaires, qui nous occupera durant 3 parties.

  2. Un petit jeu de données plein d'erreurs, qu'il vous faudra nettoyer. Il nous occupera durant 1 partie.

Est-ce que ce sera fun ?

Je l'espère ! J'ai essayé de prendre un angle original dans ce cours : celui de vous faire analyser des données qui viennent ... de vous ! Si vous avez un compte bancaire avec une carte de paiement, et que vous pouvez consulter vos comptes sur internet, alors je vous propose de télécharger vos relevés et de répondre à certaines questions telles que :

  • Quand vous faites vos courses, à quelle vitesse consommez-vous vos produits ?

  • Combien faites-vous de stock ?

  • Consommez-vous plus en début ou en fin de mois ? les week-ends ?

  • Etes-vous plus dépensier lorsque vous avez beaucoup d'argent sur votre compte ?

  • etc.

Selon votre niveau de motivation

On a tous des attentes et des motivations différentes en arrivant sur un cours Openclassrooms. Alors, en fonction de votre niveau de motivation, voici comment il est possible de suivre ce cours :

  1. Motivation minimum : ne lire que les chapitres théoriques, sur les statistiques descriptives

  2. Motivation basse : lire les chapitres avec le code informatique

  3. Motivation normale : installer R ou Python sur votre ordinateur, et tester les exemples du cours

  4. Motivation haute : lire les sections Aller plus loin en bas des chapitres

  5. Motivation de super-héros : vous entraîner sur les 2 langages en même temps, R et Python

Pour obtenir le certificat de cours, vous devrez passer et réussir les quiz et les activités de fin de partie (il y en a 4 au total). Il est donc préférable pour cela d'avoir le niveau de motivation 3, c'est-à-dire vous entraîner sur le code R ou Python.

A la fin de certains chapitres, il y a des sections Aller plus loin. Ce sont des approfondissements qui sont facultatifs. Ne vous inquiétez pas, ils ne seront pas évalués dans les quiz et les activités de fin de partie. ;)

Python ou R ?

Python et R sont les deux langages les plus utilisés en analyse de données.

Ce cours est plus orienté vers Python, car les chapitres sont illustrés dans ce langage. Mais si vous préférez R, sachez que tout le code Python de ce cours est traduit en R, vous n'aurez donc aucun mal à suivre !

Si vous n'en maîtrisez aucun, vous aurez du mal à suivre ce cours, à moins que vous ne souhaitiez consulter que les parties théoriques. Pour choisir entre Python ou R, rendez-vous au chapitre intitulé Installez Python ou R.

Le code informatique et les données

Le code informatique (dans ses versions R et Python) ainsi que les données utilisées tout au long de ce cours sont présentes dans un fichier .zip, au chapitre Téléchargez les données.

Exemple de certificat de réussite
Exemple de certificat de réussite