Sans hypothèse supplémentaire, on ne peut pas déterminer d'intervalles de confiance sur les paramètres β1,…,βp ou tester leur significativité.
Cela devient possible si l'on ajoute une hypothèse sur la loi de l'erreur ε , et donc sur celle de la variable à expliquer Y . Le modèle linéaire gaussien multiple considère la normalité de l'erreur.
Dans le modèle linéaire gaussien multiple, on considère en plus des hypothèses formulées dans le cadre du modèle linéaire multiple :
On en déduit donc que (εi)i∈{1,…,n} est un échantillon i.i.d de loi N(0,σ2) .
Testez le modèle
Pour tester la significativité du modèle, nous avons 2 niveaux :
Un test global, obtenu grâce à une statistique de Fisher. En pratique, l'hypothèse Ho de ce test est souvent rejetée, le modèle est donc souvent significatif globalement.
Un test de significativité sur chacune des variables explicatives prises une à une. Dans ce cas, il s'agit d'un test de Student, tout comme en régression linéaire simple. Ici, tester l'un des paramètres a un réel sens : si une variable n'est pas significative, il faut la retirer du modèle. Si l'on ne la retire pas, il est possible que l'erreur de prévision du modèle soit plus élevée.
Testez la significativité globale du modèle
Dans le cas de la régression avec constante, on teste :
La statistique de test utilisée est :
On peut montrer que sous H0 :
On décide du rejet de H0 au niveau de test α si f>f(p−1,n−p),1−α .
On présente usuellement le test de significativité globale sous la forme du tableau d'analyse de la variance, avec les notations CME=SCEp−1 et CMR=SCRn−p .
Voici le tableau d'analyse de la variance :
Source | ddl | SC | CM | F | p -valeur |
E | p−1 | SCE | CME | CMECMR | P(F(p−1,n−p)>f) |
R | n−p | SCR | CMR |
|
|
T | n−1 | SCT |
|
|
|
1.5pt1-3 |
|
|
|
|
|
Testez la significativité d'un des paramètres
On teste :
pour j∈{1,…,p}
La statistique de test utilisée est :
où (X⊤X)−1jj désigne le j -ième terme diagonal de la matrice (X⊤X)−1 .
On peut montrer que sous H0 :
On décide du rejet de H0 au niveau de test α si t>tn−p,1−α .
En pratique, dire que l'on rejette cette hypothèse H0 revient à conserver la variable Xj comme explicative.
Le test est acquis, félicitations ! On peut maintenant analyser nos résultats.