Tirez un maximum de ce cours

Découvrez l’objectif du cours

Dès le deuxième chapitre de ce cours, vous allez explorer les objectifs et les avantages de DuckDB avant de l’installer sur votre ordinateur. 

Le troisième chapitre vous guidera à travers l'exploration et la centralisation des données. Vous apprendrez à connecter DuckDB à diverses sources et à structurer vos données pour des analyses efficaces.

Le quatrième et dernier chapitre se concentrera sur la transformation et l’exportation des données. Vous verrez comment optimiser vos requêtes, manipuler vos datasets et exporter vos résultats pour les visualiser ou les intégrer dans d’autres outils.

À la fin de ce cours, vous serez en mesure d’utiliser les bases de DuckDB, de son installation à l'analyse de données, et d'utiliser cet outil pour simplifier et accélérer vos traitements analytiques.

Rencontrez votre professeur

Je suis Mehdi (alias mehdio), passionné par les données, avec près de dix ans d’expérience en data engineering. J’ai travaillé avec des entreprises de toutes tailles, des grandes entreprises aux startups en hyper-croissance, en Europe comme aux États-Unis. Je suis motivé par la simplification des workflows complexes, l’utilisation d’outils comme DuckDB et la promotion de l’efficacité analytique. Si vous débutez dans le monde des données, vous avez de la chance : DuckDB est un véritable couteau suisse qui vous accompagnera dans tous les domaines, en simplifiant vos analyses et en boostant votre efficacité ! Je suis également Data Engineer & Developer Advocate chez MotherDuck, une startup qui développe une version cloud hybride de DuckDB, rendant l’analytique plus simple et plus accessible.

Découvrez le fonctionnement du cours

Ce cours suit une progression logique que l'on a séquencée en trois principaux chapitres.

Avant de démarrer, voici quelques conseils pour exploiter au mieux le contenu de ce cours et optimiser votre apprentissage :

  1. Lisez le texte dans chaque chapitre pour comprendre pourquoi les concepts abordés sont importants.

  2. Profitez de chaque occasion de pratiquer en faisant une pause dans le cours pour vous entraîner de votre côté, et reproduire pas à pas ce que vous avez lu dans le cours !

Découvrez le projet fil rouge 

Vous êtes Data Engineer et votre manager souhaite mieux comprendre l’écosystème technique de DuckDB. Elle vous a donc demandé d’analyser les langages réellement utilisés dans son dépôt GitHub en les comparant à leur popularité sur Stack Overflow. Cette analyse aidera à évaluer si les choix technologiques actuels sont toujours pertinents, à anticiper les évolutions du marché et à adapter la stratégie de développement.

Pour mener à bien la mission, vous allez suivre quatre grandes étapes :

  1. Exploration des données

  2. Ingestion et centralisation des données

  3. Transformation des données

  4. Visualisation avec DuckDB

Vous pouvez accéder aux fichiers et au code associés au cas pratique sur ce dépôt GitHub.

Prêt à installer DuckDB ? Rendez-vous dans le prochain chapitre !

Ever considered an OpenClassrooms diploma?
  • Up to 100% of your training program funded
  • Flexible start date
  • Career-focused projects
  • Individual mentoring
Find the training program and funding option that suits you best