Tester la moyenne (théorique) d'un échantillon
Le coin méthodologique
Supposons que nous ayons à disposition un échantillon i.i.d de loi , ou un grand échantillon i.i.d quelconque (en pratique de taille supérieure à 30).
On considère les tests suivants (c'est le test 3 qui est considéré dans le second exemple introductif) :
On pourrait utiliser (ou ) comme statistique de test, malheureusement sa loi dépend du paramètre inconnu, c'est pourquoi on utilise :
On a sous :
Les régions critiques au niveau sont :
.
.
.
On constate bien ici que la forme de la région critique est donnée par l'hypothèse alternative .
Les p-valeurs sont :
.
.
.
Le coin R : exemple de la consommation d'essence
On teste :
avec
Pour , on a :
On rejette au niveau de test 5% car :
La p-valeur vaut :
On constate qu’on rejette bien l’hypothèse nulle au niveau de test 5% ( ) mais pas au niveau de test 1% ( )
En pratique, le data analyst peut utiliser la commande t.test
pour résoudre ce test :
alpha <- 0.05
t.test(essence$conso,mu=31,alternative="two.sided")
## ## Results of Hypothesis Test ## -------------------------- ## ## Null Hypothesis: mean = 31 ## ## Alternative Hypothesis: True mean is not equal to 31 ## ## Test Name: One Sample t-test ## ## Estimated Parameter(s): mean of x = 31.44945 ## ## Data: essence$conso ## ## Test Statistic: t = 2.354358 ## ## Test Statistic Parameter: df = 127 ## ## P-value: 0.02008833 ## ## 95% Confidence Interval: LCL = 31.07169 ## UCL = 31.82722
Tester la variance (théorique) d'un échantillon
Supposons que nous ayons à disposition un échantillon i.i.d de loi , ou un grand échantillon i.i.d quelconque (en pratique de taille supérieure à 30).
On considère les tests suivants :
On utilise comme statistique de test :
On a sous :
Les régions critiques au niveau sont :
.
.
.
De là on tire les p-valeurs...
Le coin R : exemple de la consommation d'essence
Considérons par exemple le test suivant :
avec .
En pratique, le data analyst pourra de nouveau utiliser la commande varTest
issue du package EnvStats
pour obtenir cet intervalle de confiance :
library(EnvStats)
alpha <- 0.05
varTest(essence$conso,sigma.squared=4.5,alternative="greater")
## ## Results of Hypothesis Test ## -------------------------- ## ## Null Hypothesis: variance = 4.5 ## ## Alternative Hypothesis: True variance is greater than 4.5 ## ## Test Name: Chi-Squared Test on Variance ## ## Estimated Parameter(s): variance = 4.66481 ## ## Data: essence$conso ## ## Test Statistic: Chi-Squared = 131.6513 ## ## Test Statistic Parameter: df = 127 ## ## P-value: 0.3706697 ## ## 95% Confidence Interval: LCL = 3.839436 ## UCL = Inf
On ne rejette donc pas l’hypothèse nulle au niveau de test 5%, la p-valeur vaut en effet environ 0.37 (elle n’est évidemment pas inférieure à 0.05).