Data
Modélisez vos données avec les méthodes ensemblistes
Après avoir étudié les méthodes supervisées linéaires et non-linéaire les plus utilisés dans les cours précédent, il est temps d'aborder la famille des méthodes ensemblistes.
Êtes-vous prêt·e à décupler la puissance de vos modèles grâce aux méthodes ensemblistes ? C'est ce que nous allons voir dans ce cours, en nous intéressant à une famille d'algorithme parmi les plus performantes actuellement.
En effet, en utilisant de manière rusée notre jeu de données, nous pouvons exploiter tout son potentiel, en créant un grand nombre de petit modèles rapidement puis en développant un méta-modèle qui les rassemble.
Suivez ce cours pour apprendre les deux familles de modèles les plus utilisées par les data scientists : les méthodes parallèles avec les forêts aléatoires et les méthodes séquentielles dont le modèle phare est le gradient boosting.
Objectifs pédagogiques
- Utiliser les méthodes parallèles telles que le bagging ou les forêts aléatoires
- Découvrir les méthodes séquentielles
- Comprendre le concept de boosting
- Savoir utiliser le package xgboost
Et si vous en faisiez votre métier ?
Suivez une des formations diplômantes de notre école 100% en ligne, et transformez vos connaissances en compétences professionnelles.
- Formations jusqu’à 100 % financées
- Date de début flexible
- Projets professionnalisants
- Mentorat individuel
1/3
Table des matières
- Partie 1
Apprivoisez les méthodes parallèles
- Partie 2
Maîtrisez les méthodes séquentielles

Data