All courses

Data

Réalisez des calculs distribués avec Spark

Apprenez à traiter et analyser des données massives avec Spark, explorez son écosystème et découvrez comment en tirer le meilleur pour vos projets.
Hard
4 hours
Interested in this free-access course?

Bienvenue dans ce cours sur le calcul distribué avec Apache Spark ! Destiné aux data engineers, aux développeurs et à tous les professionnels de la data, ce cours vous permettra d'apprendre à traiter des volumes massifs de données efficacement en exploitant les capacités de Spark.

Dans un monde où la quantité de données produites double tous les deux ans et où plus de 90 % des données mondiales ont été générées au cours de la dernière décennie, il est essentiel de comprendre comment distribuer le traitement de ces données sur plusieurs machines. C’est précisément ce que permet Apache Spark : un framework puissant, rapide et optimisé pour le Big Data et l’intelligence artificielle. Le saviez-vous ? Des entreprises comme Netflix et Uber utilisent Spark pour analyser en temps réel des pétaoctets de données, leur permettant d'optimiser recommandations et trajets en quelques millisecondes.

Au fil de ce cours, nous allons découvrir comment tirer parti de Spark pour réaliser des calculs distribués, en combinant théorie et pratique pour vous rendre pleinement opérationnel.

Learning outcomes

  • Naviguer dans l'écosystème Spark
  • Aller plus loin avec l'écosystème Spark

Requirements

Avant de commencer, assurez-vous de disposer des connaissances et outils suivants :

  • Des bases en programmation Python ;
  • Un environnement de travail configuré avec Python et Jupyter Notebook ;

Vous pouvez suivre ce cours pour développer vos compétences :

Turn it into a career

Choose one of our 100% online degree programs, and transform your know-how into professional skills.

  • Up to 100% of your training program funded
  • Flexible start date
  • Career-focused projects
  • Individual mentoring

Contributors

Instructor

Aurelien Quillet

Enseignant passionné en data science et IA, expert en Python, je vous aide à créer des dashboards, modèles ML, et rapports statistiques.

Created by

Last updated: 2/13/2025
License

Data

Réalisez des calculs distribués avec Spark

Hard
4 hours
Free-access course