All courses

Data

Modélisez vos données avec les méthodes ensemblistes

Décuplez la robustesse et l’efficacité de vos algorithmes à l’aide des méthodes ensemblistes, le bagging et le boosting. Vous découvrirez aussi les forêts aléatoires et le très prisé XGBoost.
Medium
15 hours
Interested in this free-access course?

Après avoir étudié les méthodes supervisées linéaires et non-linéaire les plus utilisés dans les cours précédent, il est temps d'aborder la famille des méthodes ensemblistes.

Êtes-vous prêt·e à décupler la puissance de vos modèles grâce aux méthodes ensemblistes ? C'est ce que nous allons voir dans ce cours, en nous intéressant à une famille d'algorithme parmi les plus performantes actuellement.

En effet, en utilisant de manière rusée notre jeu de données, nous pouvons exploiter tout son potentiel, en créant un grand nombre de petit modèles rapidement puis en développant un méta-modèle qui les rassemble.

Suivez ce cours pour apprendre les deux familles de modèles les plus utilisées par les data scientists : les méthodes parallèles avec les forêts aléatoires et les méthodes séquentielles dont le modèle phare est le gradient boosting

Learning outcomes

  • Utiliser les méthodes parallèles telles que le bagging ou les forêts aléatoires
  • Découvrir les méthodes séquentielles
  • Comprendre le concept de boosting
  • Savoir utiliser le package xgboost

Contributors

Instructor

Yannis Chaouche

Newsletter hebdomadaire pour les data scientists - mlacademy.substack.com

Created by

Last updated: 8/12/2025
License

Data

Modélisez vos données avec les méthodes ensemblistes

Medium
15 hours
Free-access course