À vous de jouer !
Dans cette activité, vous devez ré-implémenter la fonction de validation croisée de la libraire scikit-learn (la fonction GridSearchCV), dans l’objectif d’effectuer la classification du dataset sur la qualité du vin. Pour cela, vous pourrez réutiliser le code du TP du chapitre précédent comme base de travail.
L’algorithme devra permettre d’optimiser l’accuracy du modèle. La fonction prendra en entrée le tableau des hyperparamètres à tester ainsi que le nombre de folds. On utilisera des folds exacts (non randomisé) afin de pouvoir comparer les résultats.
Vous pourrez ensuite comparer les performances de votre implémentation par rapport à l’implémentation scikit-learn effectuée lors du TP. Pour cela, je vous conseille dans un premier temps de ne pas randomiser la sélection des sets, mais de faire une sélection exacte afin de pouvoir comparer des résultats qui doivent être identiques entre votre implémentation et celle de scikit.
À l'issue de votre mission, vous devez fournir :
le classeur iPython avec l’implémentation de la fonction.
le code modifié du TP permettant l’application et l’évaluation du K-nn avec votre fonction de validation croisée.
À vous de jouer !
Vérifiez votre travail
Vous avez rempli votre mission si :
Votre fonction de validation croisée fournit le même résultat que la fonction scikit originale.
L'algorithme fonctionne.
Vous avez correctement effectué l'évaluation.