Data

Modélisez vos données avec les méthodes ensemblistes

Décuplez la robustesse et l’efficacité de vos algorithmes à l’aide des méthodes ensemblistes, le bagging et le boosting. Vous découvrirez aussi les forêts aléatoires et le très prisé XGBoost.

Medium

15 hours

Interested in this free-access course?

Start

Après avoir étudié les méthodes supervisées linéaires et non-linéaire les plus utilisés dans les cours précédent, il est temps d'aborder la famille des méthodes ensemblistes.

Êtes-vous prêt·e à décupler la puissance de vos modèles grâce aux méthodes ensemblistes ? C'est ce que nous allons voir dans ce cours, en nous intéressant à une famille d'algorithme parmi les plus performantes actuellement.

En effet, en utilisant de manière rusée notre jeu de données, nous pouvons exploiter tout son potentiel, en créant un grand nombre de petit modèles rapidement puis en développant un méta-modèle qui les rassemble.

Suivez ce cours pour apprendre les deux familles de modèles les plus utilisées par les data scientists : les méthodes parallèles avec les forêts aléatoires et les méthodes séquentielles dont le modèle phare est le gradient boosting.

Learning outcomes

Utiliser les méthodes parallèles telles que le bagging ou les forêts aléatoires
Découvrir les méthodes séquentielles
Comprendre le concept de boosting
Savoir utiliser le package xgboost

Part 1
Apprivoisez les méthodes parallèles
Part 2
Maîtrisez les méthodes séquentielles

Contributors

Instructor

Yannis Chaouche

Newsletter hebdomadaire pour les data scientists - mlacademy.substack.com

Created by

OpenClassrooms

Last updated: 8/12/2025

License

Data