On souhaite cette fois expliquer, de manière linéaire, une variable (variable à expliquer), aléatoire en fonction de variables , et non plus d'une seule variable.
Extension naturelle du modèle de régression linéaire simple, le modèle de régression linéaire multiple suppose que :
où :
est une v.a.r, observable ;
sont déterministes (non aléatoires), observables ;
sont des paramètres inconnus (non observables) ;
, l'erreur du modèle, est une v.a.r centrée de variance inconnue (c'est également un paramètre du modèle).
Dans le cas de l'ozone, on considérera le pic d'ozone journalier pour et les différentes variables météorologiques (température, vitesse du vent, etc.), ainsi que le pic d'ozone de la veille pour .
Les données
On considère ici que l'on dispose de observations d'un échantillon i.i.d de :
De manière identique à la régression linéaire simple, les erreurs vérifient pour :
(elles sont centrées autour de 0) ;
(leur variance, inconnue, est constante et égale à ) ;
si (elles n'ont pas de dépendance linéaire).
Matriciellement, on peut réécrire le problème sous la forme suivante :
où :
Régression linéaire multiple avec ou sans constante
En présence d'un terme constant dans le modèle, on considérera que la première variable est égale à 1 :
On est alors en présence de vraies variables explicatives et de paramètres à estimer (avec en sus qui reste à estimer quel que soit le cas).
Linéarisation de modèles de régression
Il est possible de considérer comme variables explicatives des transformations (puissance, exponentielle, logarithme, etc.) de .
Après cette introduction au modèle, continuons avec la méthode des Moindres Carrés Ordinaires, que vous avez découverte dans la partie précédente...