• 12 hours
  • Medium

Free online content available in this course.

course.header.alt.is_video

course.header.alt.is_certifying

Got it!

Last updated on 9/5/19

Testez une moyenne ou une variance

Log in or subscribe for free to enjoy all this course has to offer!

Tester la moyenne (théorique) d'un échantillon

Le coin méthodologique

Supposons que nous ayons à disposition un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$, ou un grand échantillon i.i.d quelconque (en pratique de taille supérieure à 30).
On considère les tests suivants (c'est le test 3 qui est considéré dans le second exemple introductif) :

  1. $\(\begin{cases}H_{0}:\mu=\mu_{0}\\H_{1}:\mu>\mu_{0}\end{cases}\)$

  2. $\(\begin{cases} H_{0}:\mu=\mu_{0}\\ H_{1}:\mu<\mu_{0} \end{cases}\)$

  3. $\(\begin{cases} H_{0}:\mu=\mu_{0}\\ H_{1}:\mu\neq\mu_{0} \end{cases}\)$

On pourrait utiliser $\(\overline{X}-\mu_0\)$ (ou $\(\overline{X}\)$) comme statistique de test, malheureusement sa loi dépend du paramètre $\(\sigma\)$ inconnu, c'est pourquoi on utilise :

$\[T=\sqrt{n} \frac{\overline{X}-\mu_{0}}{S^\prime}\]$

On a sous $\(H_{0}\)$ :

$\[T\sim\mathcal{T}\left( n-1\right)\]$

Les régions critiques au niveau $\(\alpha\)$ sont :

  1.   $\(W=\left\{ T>t_{n-1,1-\alpha}\right\} \)$.

  2.   $\(W=\left\{ T<-t_{n-1,1-\alpha}\right\}\)$ .

  3.   $\(W=\left\{ \left| T\right| >t_{n-1,1-\frac{\alpha}{2}}\right\} \)$.

On constate bien ici que la forme de la région critique est donnée par l'hypothèse alternative $\(H_1\)$.

Les p-valeurs sont :

  1.  $\(\mathbb{P}\left( \mathcal{T}\left( n-1\right) \geq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right) \)$.

  2.  $\(\mathbb{P}\left( \mathcal{T}\left( n-1\right) \leq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right) \)$.

  3.  $\(\mathbb{P}\left( \left| \mathcal{T}\left( n-1\right)\right| \geq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right)=2\, \mathbb{P}\left( \mathcal{T}\left( n-1\right) \geq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right) \)$.

Le coin R : exemple de la consommation d'essence

On teste :

$\[\begin{cases}H_{0}:\mu=\mu_{0}\\H_{1}:\mu\neq\mu_{0}\end{cases}\]$

avec  $\(\mu_0 = 0.31\)$

Pour $\(\alpha = 5%\)$ , on a :

  •  $\(t_{n-1,1-\frac{\alpha}{2}}=t_{127,0.975}\simeq 1.97\)$

  •  $\(\left\vert\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s^\prime}\right\vert\simeq\left\vert\sqrt{128}\ \frac{31.45-31}{2.16}\right\vert\simeq 2.35\ .\)$

On rejette $\(H_0\)$ au niveau de test 5% car :

$\[\left\vert\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s^\prime}\right\vert=2.35>1.97\simeq t_{n-1,1-\frac{\alpha}{2}}\ .\]$

La p-valeur vaut :
 $\(\begin{align*}\operatorname{p-valeur}&=\mathbb{P}\left( \left| \mathcal{T}\left( n-1\right)\right| \geq\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s}\right)\\&=2\left(1-\mathbb{P}\left( \mathcal{T}\left( n-1\right) \leq\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s}\right)\right) \\&\simeq 2\left(1-\mathbb{P}\left( \mathcal{T}\left( 127\right) \leq 2.35\right)\right) \\&\simeq0.02\ .\end{align*}\)$

On constate qu’on rejette bien l’hypothèse nulle au niveau de test 5% ( $\(0.02\lt0.05\)$ ) mais pas au niveau de test 1% ( $\(0.02\geq0.05\)$ )

En pratique, le data analyst peut utiliser la commande  t.test  pour résoudre ce test :

alpha <- 0.05
t.test(essence$conso,mu=31,alternative="two.sided")
## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: mean = 31
## 
## Alternative Hypothesis: True mean is not equal to 31
## 
## Test Name: One Sample t-test
## 
## Estimated Parameter(s): mean of x = 31.44945
## 
## Data: essence$conso
## 
## Test Statistic: t = 2.354358
## 
## Test Statistic Parameter: df = 127
## 
## P-value: 0.02008833
## 
## 95% Confidence Interval: LCL = 31.07169
## UCL = 31.82722

Tester la variance (théorique) d'un échantillon

Supposons que nous ayons à disposition un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$, ou un grand échantillon i.i.d quelconque (en pratique de taille supérieure à 30).
On considère les tests suivants :

  1. $\(\begin{cases} H_{0}:\sigma^{2}=\sigma_{0}^{2}\\ H_{1}:\sigma^{2}>\sigma_{0}^{2} \end{cases}\)$

  2. $\(\begin{cases} H_{0}:\sigma^{2}=\sigma_{0}^{2}\\ H_{1}:\sigma^{2}<\sigma_{0}^{2} \end{cases}\)$

  3. $\(\begin{cases} H_{0}:\sigma^{2}=\sigma_{0}^{2}\\ H_{1}:\sigma^{2}\neq\sigma_{0}^{2} \end{cases}\)$

On utilise comme statistique de test :

$\[K=\left( n-1\right) \frac{S^{\prime 2}}{\sigma_{0}^{2}}\]$

On a sous $\(H_{0}\)$ :

  $\(K\sim\chi^{2}(n-1)\)$

Les régions critiques au niveau $\(\alpha\)$ sont :

  1.  $\(W=\left\{ K>\chi_{n-1,1-\alpha}^{2}\right\}\)$ .

  2.  $\(W=\left\{ K<\chi_{n-1,\alpha}^{2}\right\}\)$ .

  3.  $\(W=\left\{ K<\chi_{n-1,\frac{\alpha}{2}}^{2}\text{ ou }K>\chi_{n-1,1-\frac{\alpha}{2}}^{2}\right\}\)$ .

De là on tire les p-valeurs...

Le coin R : exemple de la consommation d'essence

Considérons par exemple le test suivant :

$\[\begin{cases}H_{0}:\sigma^2=\sigma_{0}^2\\H_{1}:\sigma^2\gt\sigma_{0}^2\end{cases}\]$

avec $\(\sigma_{0}^2=4.5\)$ .

En pratique, le data analyst pourra de nouveau utiliser la commande  varTest  issue du package  EnvStats  pour obtenir cet intervalle de confiance :

library(EnvStats)
alpha <- 0.05
varTest(essence$conso,sigma.squared=4.5,alternative="greater")

## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: variance = 4.5
## 
## Alternative Hypothesis: True variance is greater than 4.5
## 
## Test Name: Chi-Squared Test on Variance
## 
## Estimated Parameter(s): variance = 4.66481
## 
## Data: essence$conso
## 
## Test Statistic: Chi-Squared = 131.6513
## 
## Test Statistic Parameter: df = 127
## 
## P-value: 0.3706697
## 
## 95% Confidence Interval: LCL = 3.839436
## UCL = Inf

On ne rejette donc pas l’hypothèse nulle au niveau de test 5%, la p-valeur vaut en effet environ 0.37 (elle n’est évidemment pas inférieure à 0.05).

Example of certificate of achievement
Example of certificate of achievement