Tous les cours

Data

Réalisez des calculs distribués avec Spark

Apprenez à traiter et analyser des données massives avec Spark, explorez son écosystème et découvrez comment en tirer le meilleur pour vos projets.
Difficile
4 heures
Ce cours en libre accès vous intéresse ?

Bienvenue dans ce cours sur le calcul distribué avec Apache Spark ! Destiné aux data engineers, aux développeurs et à tous les professionnels de la data, ce cours vous permettra d'apprendre à traiter des volumes massifs de données efficacement en exploitant les capacités de Spark.

Dans un monde où la quantité de données produites double tous les deux ans et où plus de 90 % des données mondiales ont été générées au cours de la dernière décennie, il est essentiel de comprendre comment distribuer le traitement de ces données sur plusieurs machines. C’est précisément ce que permet Apache Spark : un framework puissant, rapide et optimisé pour le Big Data et l’intelligence artificielle. Le saviez-vous ? Des entreprises comme Netflix et Uber utilisent Spark pour analyser en temps réel des pétaoctets de données, leur permettant d'optimiser recommandations et trajets en quelques millisecondes.

Au fil de ce cours, nous allons découvrir comment tirer parti de Spark pour réaliser des calculs distribués, en combinant théorie et pratique pour vous rendre pleinement opérationnel.

Objectifs pédagogiques

  • Naviguer dans l'écosystème Spark
  • Aller plus loin avec l'écosystème Spark

Prérequis

Avant de commencer, assurez-vous de disposer des connaissances et outils suivants :

  • Des bases en programmation Python ;
  • Un environnement de travail configuré avec Python et Jupyter Notebook ;

Vous pouvez suivre ce cours pour développer vos compétences :

Et si vous en faisiez votre métier ?

Suivez une des formations diplômantes de notre école 100% en ligne, et transformez vos connaissances en compétences professionnelles.

  • Formations jusqu’à 100 % financées
  • Date de début flexible
  • Projets professionnalisants
  • Mentorat individuel

Contributeurs

Professeur

Aurelien Quillet

Enseignant passionné en data science et IA, expert en Python, je vous aide à créer des dashboards, modèles ML, et rapports statistiques.

Créé par

Mis à jour le 13/02/2025
Licence

Data

Réalisez des calculs distribués avec Spark

Difficile
4 heures
Cours en libre accès