Que faut-il retenir de cette partie du cours ?
Cette partie du cours a insisté sur la stratégie à mettre en place afin d'optimiser le choix d'une méthode ou d'un algorithme d'apprentissage. Des points fondamentaux sont à retenir :
Cette démarche est appliquée sur deux jeux de données et déroulée dans les tutoriels à exécuter. Le deuxième exemple montre les très bons résultats de reconnaissance de l'activité à partir des données transformées issues des signaux d'un smartphone.
L'enjeu de la partie suivante est d'arriver à des résultats similaires mais à partir des signaux bruts, sans tous les calculs préliminaires coûteux pour la batterie d'un objet connecté.
Tutoriels
Deux tutoriels sont proposés pour illustrer et compléter le cours :
ML4IoT-Tutorial-Ozone
: les sections 4.1 et 4.2 des tutoriels illustrent la modélisation par régression et régression logistique ;ML4IoT-Tutorial-HAR
: la deuxième partie du tutoriel estime une batterie de 6 régressions logistiques pour atteindre l'objectif de reconnaissance de l'activité. D'autres algorithmes d'apprentissage sont également mis en œuvre à titre de comparaison.
Références
Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. J. Royal. Statist. Soc B., Vol. 58, No. 1, pages 267-288).
Wikistat (2018). Sélection de modèle, en ligne, page disponible le 17/05/2018.
Wikistat (2018). Régression logistique, en ligne, page disponible le 17/05/2018.
Wikistat (2018). Erreur de prévision et risque, en ligne, page disponible le 17/05/2018.