Tirez un maximum de ce cours

Découvrez l’objectif du cours

Dès le deuxième chapitre de ce cours, vous allez explorer les avantages d’Airbyte, comprendre son fonctionnement et découvrir les concepts de base associés à cet outil. Nous aborderons les raisons pour lesquelles Airbyte est devenu une référence dans le domaine de l'intégration de données.

Le troisième et dernier chapitre se concentre sur les principales fonctionnalités d’Airbyte. Vous apprendrez à :

  • choisir et configurer une source de données ;

  • définir une destination pour vos données ;

  • créer une connexion entre la source et la destination ;

  • orchestrer et automatiser les flux de données pour des transferts réguliers et fiables ;

  • utiliser Pyairbyte comme alternative à l’intégration des données. 

À la fin de ce cours, vous serez en mesure de maîtriser les bases d’Airbyte, de l’installation à l’orchestration de vos flux de données et d’utiliser cet outil pour simplifier vos projets d’intégration.

Rencontrez votre professeur

Je suis Alexandre Bergère, passionné des technologies de données et de cloud basé à Paris, spécialisé dans l'architecture des données cloud et les solutions SaaS. Actuellement, je suis Head of Data & AI Engineer chez DataGalaxy. J'ai deux passions : implémenter des modern data stacks performantes et économiques (comme DuckDB, Delta et Redpanda), et développer Kaiten, une plateforme centralisée qui simplifie la gestion des déploiements, des métriques et des fonctionnalités SaaS open source. Fort d'une solide expérience dans l'enseignement et le mentorat, je m'engage à former la prochaine génération de professionnels des données tout en contribuant activement à des projets innovants.

Découvrez le fonctionnement du cours

Ce cours suit une progression logique que l'on a séquencée en deux principaux chapitres.

Avant de démarrer, voici quelques conseils pour exploiter au mieux le contenu de ce cours et optimiser votre apprentissage :

  1. Lisez le texte dans chaque chapitre pour comprendre pourquoi les concepts abordés sont importants.

  2. Profitez de chaque occasion de pratiquer en faisant une pause dans le cours pour vous entraîner de votre côté, et reproduire pas à pas ce que vous avez lu dans le cours !

Découvrez le projet fil rouge

Vous travaillez en tant que Data Engineer pour une boutique en ligne fictive : Click et Achète. Cette boutique utilise plusieurs outils pour gérer ses opérations :

  • Des fichiers Google Sheet dans lesquels sont stockées des données historiques (comme les rapports de ventes mensuels).

  • Des fichiers JSON dans lesquels sont disponibles des données sur les retours client collectés via des formulaires web.

  • Une base de données PostgreSQL pour stocker les commandes.

  • Un CRM comme HubSpot pour suivre les interactions clients.

  • Un compte Google Analytics pour analyser le trafic sur le site web.

Cependant, actuellement, l'entreprise fait face à un grand défi de centralisation des données. Chaque équipe travaille avec des sources de données distinctes, ce qui crée des problèmes de communication et des goulots d'étranglement dans les processus d'intégration des données. Par exemple, les analystes de données et l'équipe marketing ont besoin d'une vue unifiée des données, mais la synchronisation des flux entre les systèmes (CRM, Google Analytics, PostgreSQL, fichiers CSV et JSON) prend énormément de temps de développement et n'est pas efficace.

L'objectif de l'entreprise est donc de centraliser toutes ces données provenant des différentes sources dans un bucket Amazon S3. Cela permettrait aux équipes marketing et aux analystes de données d'utiliser cette destination centralisée pour effectuer des analyses avancées, créer des rapports et mieux comprendre le comportement des clients.

Prêt à installer Airbyte ? Rendez-vous dans le prochain chapitre !

Et si vous obteniez un diplôme OpenClassrooms ?
  • Formations jusqu’à 100 % financées
  • Date de début flexible
  • Projets professionnalisants
  • Mentorat individuel
Trouvez la formation et le financement faits pour vous