• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 15/05/2023

Tirez un maximum de ce cours

Introduction

Bonjour et bienvenue dans ce cours consacré à la modélisation relationnelle pour la Data Science.

Dans ce cours, vous allez découvrir les bonnes pratiques et les connaissances fondamentales qui vous aideront à construire vos requêtes SQL dans des bases de données relationnelles.

Découvrez le plan du cours

L'objectif de ce cours est de découvrir comment manipuler ces données.

Très fréquemment, on peut écrire ces données sous forme de tableau (comme dans Excel !). Dans le jargon, un tableau s'appelle une table. Lorsque c'est le cas, on utilise alors des bases de données dites relationnelles.

Dans ce cours, vous apprendrez à manipuler des tables avec le langage SQL, qui permet d'interagir avec les bases de données relationnelles !

Dans la première partie, vous prendrez en main vos premières bases de données relationnelles.

Ensuite, dans la seconde partie du cours, vous construirez vos premières requêtes SQL pour interagir avec vos bases de données.

Pour finir, dans la dernière partie, vous appliquerez des fonctionnalités supplémentaires pour étoffer vos requêtes SQL.

Rencontrez votre professeur

Nicolas Rangeon est spécialisé dans la Data Science pratiquée en langage Python. Il accompagne des entreprises et organisations de toutes tailles sur l'utilisation de leurs données. Ce qui le passionne ? Explorer les données, les faire parler, les modéliser, bref, savoir ce qu'elles ont dans le ventre ! Nicolas enseigne depuis plusieurs années, il est d'ailleurs mentor et auteur chez OpenClassrooms.

Apprenez en pratiquant

Connaissez-vous le principe d'un cours en ligne sur OpenClassrooms ?

Ce cours suit une progression logique que l'on a séquencée en 3 parties. Chaque partie contient plusieurs chapitres, qu'il est préférable de suivre dans l'ordre.

Avant de démarrer, voici quelques conseils pour exploiter au mieux le contenu de ce cours et optimiser votre apprentissage :

  1. Regardez les vidéos à chaque début de chapitre pour comprendre pourquoi les concepts abordés sont importants.

  2. Lisez le texte en dessous, et suivez les vidéos de démonstration de Nicolas ainsi que les activités dans les “À vous de jouer” pour savoir comment vous pouvez mettre en œuvre ces concepts.

  3. Profitez de chaque occasion de pratiquer en faisant une pause dans le cours pour vous entraîner de votre côté, et reproduire pas à pas ce que vous avez lu dans le cours.

Explorez les Panama Papers

Tout au long de ce cours, je vous propose un projet fil rouge : vous vous mettrez dans la peau d'un·e data journaliste qui enquête sur le financement d'un réseau criminel.

Le point de départ de votre enquête, c'est une facture émise par une société nommée Big Data Crunchers Limited. Vous n'avez pour le moment aucune autre information.

Pour votre enquête, vous utiliserez la base de données des Panama Papers, qui sont des données initialement secrètes, mais qui ont été révélées en 2016 par le journal allemand Süddeutsche Zeitung ainsi que le Consortium international des Journalistes d'Investigation (ICIJ). Cette base de données contient des documents confidentiels provenant d'un cabinet d'avocats panaméen.

Initialement, les Panama Papers sont composés de près de 11,5 millions de documents (e-mails, courriers, contrats, etc.), pour un volume d'environ 2 Go. De ces documents écrits, l'ICIJ a tenté d'extraire les informations essentielles grâce à des algorithmes. Le résultat de cette extraction a été placé dans une base de données rendue publique. Le résultat de cette extraction automatique est parfois incorrect ou incomplet.

Prêt à vous lancer dans ce cours ? C'est parti !

Exemple de certificat de réussite
Exemple de certificat de réussite