Série temporelle et processus stochastique
On considère ici un ensemble d'observations dans enregistrées à un temps spécifique , on parle alors de série temporelle univariée à temps discret.
On considère en Statistique que l'observation est la réalisation d'une variable aléatoire . De manière analogue, une série temporelle sera considérée comme la réalisation d'un processus stochastique . Ce qu'il faut retenir à ce stade, c'est qu'on parle d'un processus stochastique si, pour tout fixé, est une variable aléatoire réelle.
La notion de bruit blanc
A l'issue d'une modélisation, il nous faudrait idéalement obtenir un signal résiduel qui ne contient plus d'information temporelle. Dans le cadre des modèles ARMA, on souhaite que le résidu soit un bruit blanc (faible), c'est-à-dire sans dépendance temporelle linéaire.
est un bruit blanc faible s'il est constitué de v.a.r telles que :
Une notion fondamentale : la stationnarité
Dans de très nombreux cas, on ne peut pas renouveler la suite de mesures dans des conditions identiques. Pour que le modèle déduit à partir d'une suite d'observations ait un sens, il faut que toute portion de la trajectoire observée fournisse des informations sur la loi du processus et que des portions différentes, mais de même longueur, fournissent les mêmes indications. D'où la notion de stationnarité.
Un processus est (faiblement) stationnaire si son espérance et ses autocovariances sont invariantes par translation dans le temps :
ne dépend que de l'intervalle séparant les 2 instants , pas de l'instant .
Modéliser par des processus stationnaire
Une série présentant une tendance et/ou une saisonnalité (elle sont nombreuses dans le quotidien du data analyst !) ne pourra pas être modélisée par un processus stationnaire ; une technique communément employée est de travailler non pas sur la série mais sur des différences de la série comme l'illustre l'exemple suivant.
Considérons le processus vérifiant :
avec .
On a :
et :
Contrairement à , dépend de .
Le processus n'est donc pas stationnaire.
Considérons maintenant le processus "différence première" :
On a :
D'où :
et :
et ne dépendent pas de donc est bien un processus stationnaire.
On a donc transformé un processus non stationnaire par différenciation pour obtenir un processus stationnaire .
Mesurer la dépendance temporelle linéaire
La fonction d'autocovariance
Les modèles ARMA sont linéaires, afin de définir leur structure nous utiliserons les autocorrélogrammes simples et partiels basés sur la fonction d'autocovariance.
On appelle fonction d'autocovariance d'un processus stationnaire la fonction suivante :
est une fonction symétrique :
On pourra donc calculer la fonction d'autocovariance pour .
L'autocorrélogramme simple
On appelle autocorrélogramme simple d'un processus stationnaire la fonction suivante :
Il s'agit d'une simple normalisation de la fonction d'autocovariance.
L'autocorrélogramme partiel
On constate que la corrélation existant entre 2 instants successifs d'un processus stationnaire se "diffuse". Il s'avère intéressant de connaître la corrélation entre 2 instants éloignés d'un processus conditionnellement aux instants intermédiaires, il s'agit là de l'\red{autocorrélogramme partiel} noté :
Afin de les déterminer, on calcule au préalable les autocorrélations simples et on les déduit à l'aide de l'algorithme de Durbin-Levinson (non abordé dans ce cours).
Estimer les moments d'un processus stationnaire
Soit un processus stationnaire.
A partir de , on peut considérer les estimateurs suivants :
Remarquons que :
Estimer pour des valeurs élevées de peut devenir délicat au vu du nombre d'observations en jeu. En pratique on n'excède pas un quart de la taille de la série temporelle.
On peut mener les calculs même lorsque le processus n'est pas stationnaire ! Les logiciels le font par défaut, le data analyst devra évaluer la pertinence du calcul.
Les estimations des autocorrélations partielles se déduisent des estimations des autocorrélations simples grâce à l'algorithme de Durbin-Levinson.
Tester la blancheur d'un résidu
A l'issue d'une modélisation ARMA, il faudra tester la blancheur du résidu à partir de l'autocorrélogramme simple.
Soit un processus stationnaire.
Considérons le test suivant :
Si on dispose de , on considère la statistique de Portmanteau (calculée sur les premières estimations des autocorrélations) :
Une trop grande valeur de indique que les autocorrélations sont trop importantes pour être celles d'un bruit blanc (en effet ces autocorrélations sont théoriquement nulles pour un bruit blanc).
Il existe d'autres versions de cette statistiques, par exemple la statistique de Ljung–Box :
Sous (ainsi que ) suit asymptotiquement une loi du Khi-deux à degrés de liberté :
On rejette donc l'hypothèse au niveau de test si :
où désigne le quantile d'ordre d'une loi du Khi-deux à degrés de liberté.
La p-valeur vaut :
Vers les processus ARMA
Il existe un résultat théorique, nommé décomposition de Wold, qui nous indique que tout processus stationnaire peut être modélisé par un processus ARMA, ce résultat est remarquable car il rend universel le modèle linéaire sur des processus stationnaires.