Data Engineer

Concevez et gérez les données de demain

Période de formation
9 mois à temps plein
Durée de la formation
603 heures supervisées

Une formation flexible 100% en ligne

Démarrez à tout moment votre nouvelle carrière ! Disponible à temps partiel ? Pas de problème, étudiez à votre rythme.

Des projets professionnalisants

Apprenez les compétences clés de votre futur métier en validant 13 projets tirés de cas concrets d’entreprise.

Un accompagnement personnalisé

Bénéficiez de sessions de mentorat avec un expert du métier.

Diplôme de niveau 7 (bac +5)

Décrochez une certification professionnelle « Expert en ingénierie et science des données».
DataData Engineer
Certification
Diplôme de niveau 7 (bac +5)
Période de formation
9 mois à temps plein
Durée de la formation
603 heures supervisées

Devenir Data Engineer : concevoir et gérer les données de demain !

Le Data Engineer est un expert en gestion et transformation de données. Son rôle est crucial pour la mise en place de pipelines de données fiables et efficaces, permettant aux entreprises de tirer pleinement parti de leurs informations.

Ce que vous apprendrez :

  • Effectuer l'analyse prédictive et le machine learning en transformant des données brutes en insights exploitables. Vous comprendrez et anticiperez les tendances.
  • Améliorer les processus décisionnels et apporter une valeur stratégique ajoutée à votre organisation.
  • Mettre en place des architectures de données afin de structurer et organiser les flux d'informations. Cela inclut la sélection des technologies appropriées et la création d'architectures évolutives.
  • Développer des pipelines de données robustes pour garantir l'intégrité et la qualité des données. Cela comprend l'automatisation des processus de collecte et de transformation des données.
  • Optimiser la gestion des bases de données afin d'assurer des performances optimales. Vous surveillerez les performances des bases de données. Vous apprendrez à résoudre les problèmes de goulot d'étranglement en vous assurant que les systèmes fonctionnent.
  • Implémenter une solution de stockage de données pour répondre aux besoins spécifiques des projets. Vous devrez choisir entre différentes options de stockage : bases de données relationnelles, NoSQL, data lakes, etc., en fonction des exigences du projet.
  • Collaborer avec les équipes de data science et d'analyse pour comprendre leurs besoins et fournir des données prêtes à l'emploi. 
  • Appliquer des techniques de machine learning pour analyser les données et développer des modèles prédictifs. Vous utiliserez des algorithmes de machine learning pour résoudre des problèmes complexes et extraire des insights.
  • Gérer des projets de bout en bout en définissant les objectifs, en planifiant les étapes et en assurant la livraison des solutions de données dans les délais impartis. Vous coordonnerez les équipes et les ressources pour mener à bien les projets tout en respectant les contraintes.

Nos formations vous permettent d’apprendre par la pratique

 

80% de pratique, 20% de théorie

 

Vous êtes accompagné par un mentor, professionnel du métier, tout au long de votre formation

 

                                                                                              Fayçal, un des mentors sur le parcours Data Analyst 

Fayçal, un des mentors sur un parcours Data

« Parfois, les étudiants ont peur du jugement des autres, ou tout simplement d'échouer. Mon rôle de mentor, c’est de leur rappeler qu'ils sont en formation, et qu'ils sont là pour tester le plus de choses possible. Plus ils essaient, plus ils vont avoir des retours sur leur travail. Cette approche permet de nourrir leur curiosité et de les aider à aller plus vite ! » Fayçal

 

                                          
                                                   

Vos opportunités de carrière et d’emploi à la suite de ce programme 

En suivant notre formation en ligne, vous pourrez exercer les métiers de Data Engineer ou Analytics Engineer.  

Les salaires du marché pour le poste de Data Engineer

Le salaire dépend notamment du niveau d'ancienneté*

  • 44000 € : brut annuel pour un profil débutant
  • 51000 € : brut annuel pour un profil confirmé

Cette fourchette peut toutefois varier selon la taille de l'entreprise et la région. 

* Glassdoor 

 

Et si vous suiviez cette formation en alternance ?

La formation de Data Engineer est disponible en contrat de professionnalisation et en apprentissage. 

Avec OpenClassrooms vous pouvez démarrer votre alternance à n’importe quel moment de l’année. Votre formation est financée par l’entreprise et vous touchez un salaire mensuel, calculé selon votre situation. En plus des projets concrets à valider dans la formation, vous pouvez mettre en pratique directement vos compétences acquises durant votre parcours. 

Pour vous soutenir dans cette démarche, les équipes d’OpenClassrooms vous aident à trouver une entreprise prête à vous embaucher dès le début de vos études !

Découvrez-en plus sur l’alternance en ligne chez OpenClassrooms.

 

Nos alumni racontent

 

Les pré-requis pour postuler

Pour accéder directement à la certification, les candidats doivent obligatoirement justifier d'un des pré-requis suivants :

  • Être titulaire d’une certification professionnelle de niveau 6 (bac+3 ou équivalent) en mathématiques, informatique, technologie, économie, finance ou analyse de données.

ou

  • Être titulaire d’une certification professionnelle de niveau 5 (ou équivalent) avec une expérience professionnelle d’au moins 2 ans en mathématiques, informatique, technologie, économie, finance ou analyse de données.

Langues :

  • Un niveau B2 minimum en français
  • Un niveau B2 est recommandé en anglais

 

Tout autre profil fera l'objet d'une procédure dérogatoire, à savoir :

  • être titulaire d'une certification professionnelle de niveau 6 (bac+3 ou équivalent) tous domaines avec une expérience professionnelle tous secteurs d'au moins 1 an ; 
  • et effectuer un test de positionnement. Ce test vous sera transmis lors du processus d’admission.

Matériel et logiciels : L'accès à un ordinateur (PC ou Mac) muni d’un casque son, d’une webcam et d’une bonne connexion Internet (3,2 Mbps en envoi et 1,8 Mbps en réception de données). Pour tester la qualité de votre connexion, cliquez sur ce lien. De plus, il faut être administrateur de votre ordinateur, afin de pouvoir installer des programmes complémentaires. Ce parcours nécessite d'être équipé d'un ordinateur avec les spécifications suivantes :

    • Core i3 ou AMD Ryzen 3 minimum (idéalement core i7 ou AMD Ryzen 7) 
    • Mémoire vive (RAM) de 8 Go minimum (16 Go idéalement, mais possibilité d'utiliser Google Colaboratory pour les fichiers de données les plus importants du parcours, avec un compte gratuit) 
    • Espace disque disponible 256 Go, SSD idéalement.

Votre diplôme

  • OpenClassrooms est un établissement privé d’enseignement à distance déclaré au rectorat de l’Académie de Paris.
  • À l’issue de votre formation, sous réserve de validation de vos compétences par un jury, vous pourrez obtenir la certification professionnelle « Expert en ingénierie et science des données » enregistrée au Répertoire National des Certifications Professionnelles, de niveau 7 (bac +5) sur les cadres français et européens des certifications (European Qualifications Framework). Cette validation implique d'attester des pré-requis nécessaires et sous réserve que vous terminiez votre parcours dans un délai de 3 ans maximum à compter de votre premier jour de formation (durées ajustées pour les personnes en situation de handicap ou justifiant de besoins spécifiques).
  • Si vous envisagez une poursuite d’études, contactez au préalable l’université ou l’école concernée pour connaître la procédure d’équivalence.
DataData Engineer
Certification
Diplôme de niveau 7 (bac +5)
Période de formation
9 mois à temps plein
Durée de la formation
603 heures supervisées

Une pédagogie basée sur la pratique

  • Obtenez des compétences clés en validant des projets professionnalisants.
  • Progressez à l'aide d'un expert du métier.
  • Gagnez un véritable savoir-faire ainsi qu’un portfolio pour le démontrer.

Les projets et compétences en détail

projet 1

Découvrez votre formation de Data Engineer

Mettez-vous dans les meilleures conditions pour réussir votre parcours : projetez-vous dans votre formation, définissez votre planning et appropriez-vous les outils essentiels pour apprendre.
13 heures supervisées
Compétences acquises dans ce projet
  • Définir le cadre de votre formation
projet 2

Analysez les données de systèmes éducatifs

Renforcez vos fondamentaux de Python pour la Data Science en analysant les données de systèmes éducatifs
30 heures supervisées
Compétences acquises dans ce projet
  • Appliquer des analyses statistiques descriptives et naviguer visuellement dans les données
  • Configurer l’environnement de travail nécessaire à l’exploitation des données
  • Corriger les anomalies manuellement et à l’aide d'outils adaptés
projet 3

Entraînez-vous avec SQL et créez votre BDD

Renforcez vos compétences en SQL pour réussir votre parcours de Data Engineer
30 heures supervisées
Compétences acquises dans ce projet
  • Créer des bases de données relationnelles afin de contenir les données
  • Structurer les données et leurs relations en cohérence avec leurs caractéristiques
projet 4

Auditez un environnement de données

Faites du retro engineering sur une infrastructure de données et présentez votre rapport
40 heures supervisées
Compétences acquises dans ce projet
  • Analyser la donnée afin d'en determiner l'adéquation au regard des besoins identifiés
  • Effectuer un prototype de la solution afin d’en confirmer la faisabilité technique.
  • Identifier et évaluer les risques de la solution data
  • Identifier une solution technique afin de répondre aux besoins
  • Présenter le projet data et expliquer ses choix afin d’en démontrer la pertinence
projet 5

Maintenez et documentez un système de stockage des données sécurisé et performant

Aidez une entreprise à maintenir et à documenter son système de stockage des données sécurisé pour le rendre performant et optimisé sur le plan energétique
40 heures supervisées
Compétences acquises dans ce projet
  • Définir et formaliser les processus de traitement et de stockage des données
  • Mettre en place un système d'authentification afin de garantir la sécurité des données
  • Configurer l'environnement de travail
projet 6

Anticipez les besoins en consommation de bâtiments

Aidez une grande ville à atteindre son objectif de neutralité en émissions de carbone
50 heures supervisées
Compétences acquises dans ce projet
  • Entraîner un modèle d’apprentissage
  • Évaluer le modèle d'apprentissage
  • Exposer les résultats aux directions (via une API) en vue de leur exploitation
  • Identifier ou créer une API compatible et l’intégrer pour permettre l’accès aux résultats
  • Préparer et transformer des données afin de les adapter au modèle d’apprentissage.
  • Présenter ses résultats
projet 7

Concevez et analysez une base de données NoSQL

Combinez vos compétences en Python et en bases de données NoSQL (MongoDB) pour manipuler, requêter et analyser de grands volumes de données.
50 heures supervisées
Compétences acquises dans ce projet
  • Construire et manipuler des bases de données
  • Élaborer un processus
  • Schématiser une architecture physique on premise
  • Schématiser une solution de collecte et de stockage des données
projet 8

Construisez et testez une infrastructure de données

Construisez votre premier système complexe de gestion des données de la modélisation au test de fonctionnalité
50 heures supervisées
Compétences acquises dans ce projet
  • Définir et formaliser les processus de traitement et de stockage des données
  • Établir et exécuter un processus de test du SGDB
  • Installer et paramétrer un système de gestion de base de données et un outil d’extraction
  • Installer et tester l'infrastructure de gestion des données
  • Modéliser une infrastructure compatible avec le SI
  • Structurer l’architecture des données et concevoir des BDD
projet 9

Modélisez une infrastructure dans le cloud

Modélisez votre infrastructure dans le cloud
60 heures supervisées
Compétences acquises dans ce projet
  • Identifier et sélectionner les composants nécessaires à une infrastructure de données
  • Documenter son travail
  • Représenter visuellement une infrastructure de gestion des données
  • Transformer des données afin de les adapter à leur utilisation finale.
  • Charger des données afin de les stocker dans un emplacement adapté
  • Évaluer la compatibilité des composants avec l’environnement SI de l'organisation.
  • Extraire des données issues de toutes sources confondues pour les traiter ou les déplacer
projet 10

Mettez en place un pipeline d'orchestration des flux

Construisez le pipeline des flux de données d'une entreprise dans le secteur technologique
70 heures supervisées
Compétences acquises dans ce projet
  • Mettre en place l'ordonnancement des flux des données pour programmer leur déclenchement
  • Créer des processus de test afin de valider la mise en production des pipelines
projet 11

Concevez et déployez un système RAG

Réalisez un système Retrieval-Augmented Generation fonctionnel basé sur LangChain et le modèle Mistral, soutenu par une base vectorielle Faiss.
50 heures supervisées
Compétences acquises dans ce projet
  • Identifier ou créer un modèle d’apprentissage adapté aux contraintes et besoins métiers
  • Mettre en place un processus de nettoyage afin d’améliorer la qualité des données
  • Configurer l’environnement de travail nécessaire à l’exploitation des données
projet 12

Gérez un projet d'infrastructure

Aidez une plateforme d'entrainement en course à pied à automatiser leur infrastructure de données
70 heures supervisées
Compétences acquises dans ce projet
  • Ajuster les requêtes et les paramètrages des pipelines
  • Concevoir un système de suivi des flux de données pour valider leur intégration en continu
  • Mettre en place un pipeline de données automatisé et adapté au besoin
projet 13

Passez votre système IA du POC au MVP et réalisez votre portfolio de Data Engineer

Organisez le déploiement du RAG d'une entreprise et démontrez vos compétences de Data Engineer dans un portfolio
50 heures supervisées
Compétences acquises dans ce projet
  • Apporter un appui stratégique et méthodologique pour faciliter la prise de décision
  • Collecter les besoins métiers et analyser le contexte de l'organisation
  • Conduire les actions et les échanges entre les parties prenantes du projet data
  • Contrôler et analyser le projet data en termes de délais, coûts, livrables et performance
  • Définir les modalités de réalisation et de suivi du projet data et le planifier
  • Gérer plusieurs priorités et s’adapter à un environnement en constante évolution.
  • Identifier de nouvelles opportunités, solutions ou pratiques dans le champ de la data
  • S'exprimer à l'oral en respect des bonnes pratiques du métier
Diplôme
Expert en ingénierie et science des données

Un accompagnement individuel & privilégié

  • Bénéficiez de sessions individuelles avec un mentor expert du métier.
  • Progressez rapidement dans vos projets grâce à son excellence dans le partage de son savoir-faire.

La communauté OpenClassrooms

  • Comptez sur une communauté soudée d’étudiants prête à vous aider 24h/24, 7j/7.
  • Partagez vos questions et vos doutes avec des centaines d'étudiants, de mentors et de diplômés sur un réseau social privé.

Comment se déroule un parcours OpenClassrooms ?

Du choix de leur formation au premier jour de leur nouvelle carrière, nos étudiants racontent leur expérience et l'accompagnement qu'ils ont reçu, étape par étape.

Financez votre parcours

L’abonnement : une formule flexible et à la carte

Pour tous


Les avantages
  • Date de début et rythme d’études flexibles

  • Sans engagement : arrêtez à tout moment

  • Plus vite vous terminez, moins le coût final est élevé

  • Garantie embauché ou remboursé*

650 € par mois

pour une durée estimée de 9 mois soit 5 850 €

Démarrer mon inscription

Cette formation nécessite un investissement en temps estimé à 1206 heures dont 603 heures supervisées.

La durée totale de la formation se compose de :

  • 603 heures de formation supervisée avec des projets, encadrés par des mentors
  • 603 heures de formation guidée avec des cours et des ressources pédagogiques

La période de formation peut être rallongée en cas de formation à temps partiel.
La durée est estimée et dépend de votre niveau d'entrée en formation, de votre disponibilité, du temps alloué par semaine, de votre capacité et rythme d'apprentissage.

Ce parcours vous intéresse pour votre entreprise ?

Obtenir un devis ou une démo

Formation mise à jour le 19 mars 2025