Que faut-il retenir ?
Les signaux temporels bruts sont très confus, notamment à cause de leurs décalages temporels ou déphasages. Ils sont difficiles à caractériser en l'état et sont pour le moment laissés de côté. En revanche, les transformations de ces données (features) par des techniques de traitement du signal, dont leur décomposition de Fourier, présentent des caractéristiques plus encourageantes.
Ce sont 561 variables qui sont calculées sur les 9 courbes enregistrées par chaque activité des porteurs d'un smartphone. Nous sommes donc toujours dans une situation de grande dimension dont l'exploration nécessite des méthodes appropriées.
L'analyse en composantes principales permet de représenter le nuage des activités en seulement 3 dimensions avec des séparations encourageantes des classes d'activités, sans les connaître a priori ; 561 variables ou caractéristiques sont donc résumées de façon satisfaisante par l'ACP, avec seulement trois nouvelles variables ou variables principales, combinaisons linéaires de celles initiales.
Néanmoins, le nombre trop important de ces variables ne permet pas d'obtenir simplement et directement une interprétation utile des variables principales.
Comme nous sommes dans un contexte supervisé car les classes d'activités sont connues, c'est l'analyse factorielle discriminante qui est appropriée. Cette ACP particulière, calculée sur les 6 barycentres des classes en utilisant comme métrique la matrice inverse de la variance intraclasse conduit, toujours en dimension 3, à de très bonne séparations des classes. À l'exception des deux activités : assis et couché, il semble bien que toutes les autres peuvent être séparées par des hyperplans. En d'autres termes, une méthode ou un algorithme linéaire de classification supervisée devrait permettre d'atteindre l'objectif de reconnaissance de l'activité.
Tutoriels
Trois tutoriels sont proposés pour illustrer et compléter le cours :
ML4IoT-Tutorial-ACPAFD
propose de s'initier à l'ACP puis à l'AFD sur des données élémentaires ;ML4IoT-Tutorial-Ozone
, dont une section illustre l'utilisation de l'ACP ;ML4IoT-Tutorial-HAR
, dont la première partie explore les données issues des transformations des signaux bruts.
Références
Wikistat (2018). Analyse en composantes principales, en ligne, page disponible le 17/05/2018.
Wikistat (2018). Analyse factorielle discriminante, en ligne, page disponible le 17/05/2018.