• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 13/03/2024

Testez une moyenne ou une variance

Tester la moyenne (théorique) d'un échantillon

Le coin méthodologique

Supposons que nous ayons à disposition un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$, ou un grand échantillon i.i.d quelconque (en pratique de taille supérieure à 30).
On considère les tests suivants (c'est le test 3 qui est considéré dans le second exemple introductif) :

  1. $\(\begin{cases}H_{0}:\mu=\mu_{0}\\H_{1}:\mu>\mu_{0}\end{cases}\)$

  2. $\(\begin{cases} H_{0}:\mu=\mu_{0}\\ H_{1}:\mu<\mu_{0} \end{cases}\)$

  3. $\(\begin{cases} H_{0}:\mu=\mu_{0}\\ H_{1}:\mu\neq\mu_{0} \end{cases}\)$

On pourrait utiliser $\(\overline{X}-\mu_0\)$ (ou $\(\overline{X}\)$) comme statistique de test, malheureusement sa loi dépend du paramètre $\(\sigma\)$ inconnu, c'est pourquoi on utilise :

$\[T=\sqrt{n} \frac{\overline{X}-\mu_{0}}{S^\prime}\]$

On a sous $\(H_{0}\)$ :

$\[T\sim\mathcal{T}\left( n-1\right)\]$

Les régions critiques au niveau $\(\alpha\)$ sont :

  1.   $\(W=\left\{ T>t_{n-1,1-\alpha}\right\} \)$.

  2.   $\(W=\left\{ T<-t_{n-1,1-\alpha}\right\}\)$ .

  3.   $\(W=\left\{ \left| T\right| >t_{n-1,1-\frac{\alpha}{2}}\right\} \)$.

On constate bien ici que la forme de la région critique est donnée par l'hypothèse alternative $\(H_1\)$.

Les p-valeurs sont :

  1.  $\(\mathbb{P}\left( \mathcal{T}\left( n-1\right) \geq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right) \)$.

  2.  $\(\mathbb{P}\left( \mathcal{T}\left( n-1\right) \leq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right) \)$.

  3.  $\(\mathbb{P}\left( \left| \mathcal{T}\left( n-1\right)\right| \geq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right)=2\, \mathbb{P}\left( \mathcal{T}\left( n-1\right) \geq\sqrt{n} \frac{\overline{x}-\mu_{0}}{s}\right) \)$.

Le coin R : exemple de la consommation d'essence

On teste :

$\[\begin{cases}H_{0}:\mu=\mu_{0}\\H_{1}:\mu\neq\mu_{0}\end{cases}\]$

avec  $\(\mu_0 = 31\)$

Pour $\(\alpha = 5%\)$ , on a :

  •  $\(t_{n-1,1-\frac{\alpha}{2}}=t_{127,0.975}\simeq 1.97\)$

  •  $\(\left\vert\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s^\prime}\right\vert\simeq\left\vert\sqrt{128}\ \frac{31.45-31}{2.16}\right\vert\simeq 2.35\ .\)$

On rejette $\(H_0\)$ au niveau de test 5% car :

$\[\left\vert\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s^\prime}\right\vert=2.35>1.97\simeq t_{n-1,1-\frac{\alpha}{2}}\ .\]$

La p-valeur vaut :
 $\(\begin{align*}\operatorname{p-valeur}&=\mathbb{P}\left( \left| \mathcal{T}\left( n-1\right)\right| \geq\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s}\right)\\&=2\left(1-\mathbb{P}\left( \mathcal{T}\left( n-1\right) \leq\sqrt{n}\ \frac{\overline{x}-\mu_{0}}{s}\right)\right) \\&\simeq 2\left(1-\mathbb{P}\left( \mathcal{T}\left( 127\right) \leq 2.35\right)\right) \\&\simeq0.02\ .\end{align*}\)$

On constate qu’on rejette bien l’hypothèse nulle au niveau de test 5% ( $\(0.02\lt0.05\)$ ) mais pas au niveau de test 1% ( $\(0.02\geq0.05\)$ )

En pratique, le data analyst peut utiliser la commande  t.test  pour résoudre ce test :

alpha <- 0.05
t.test(essence$conso,mu=31,alternative="two.sided")
## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: mean = 31
## 
## Alternative Hypothesis: True mean is not equal to 31
## 
## Test Name: One Sample t-test
## 
## Estimated Parameter(s): mean of x = 31.44945
## 
## Data: essence$conso
## 
## Test Statistic: t = 2.354358
## 
## Test Statistic Parameter: df = 127
## 
## P-value: 0.02008833
## 
## 95% Confidence Interval: LCL = 31.07169
## UCL = 31.82722

Tester la variance (théorique) d'un échantillon

Supposons que nous ayons à disposition un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$, ou un grand échantillon i.i.d quelconque (en pratique de taille supérieure à 30).
On considère les tests suivants :

  1. $\(\begin{cases} H_{0}:\sigma^{2}=\sigma_{0}^{2}\\ H_{1}:\sigma^{2}>\sigma_{0}^{2} \end{cases}\)$

  2. $\(\begin{cases} H_{0}:\sigma^{2}=\sigma_{0}^{2}\\ H_{1}:\sigma^{2}<\sigma_{0}^{2} \end{cases}\)$

  3. $\(\begin{cases} H_{0}:\sigma^{2}=\sigma_{0}^{2}\\ H_{1}:\sigma^{2}\neq\sigma_{0}^{2} \end{cases}\)$

On utilise comme statistique de test :

$\[K=\left( n-1\right) \frac{S^{\prime 2}}{\sigma_{0}^{2}}\]$

On a sous $\(H_{0}\)$ :

  $\(K\sim\chi^{2}(n-1)\)$

Les régions critiques au niveau $\(\alpha\)$ sont :

  1.  $\(W=\left\{ K>\chi_{n-1,1-\alpha}^{2}\right\}\)$ .

  2.  $\(W=\left\{ K<\chi_{n-1,\alpha}^{2}\right\}\)$ .

  3.  $\(W=\left\{ K<\chi_{n-1,\frac{\alpha}{2}}^{2}\text{ ou }K>\chi_{n-1,1-\frac{\alpha}{2}}^{2}\right\}\)$ .

De là on tire les p-valeurs...

Le coin R : exemple de la consommation d'essence

Considérons par exemple le test suivant :

$\[\begin{cases}H_{0}:\sigma^2=\sigma_{0}^2\\H_{1}:\sigma^2\gt\sigma_{0}^2\end{cases}\]$

avec $\(\sigma_{0}^2=4.5\)$ .

En pratique, le data analyst pourra de nouveau utiliser la commande  varTest  issue du package  EnvStats  pour obtenir cet intervalle de confiance :

library(EnvStats)
alpha <- 0.05
varTest(essence$conso,sigma.squared=4.5,alternative="greater")

## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: variance = 4.5
## 
## Alternative Hypothesis: True variance is greater than 4.5
## 
## Test Name: Chi-Squared Test on Variance
## 
## Estimated Parameter(s): variance = 4.66481
## 
## Data: essence$conso
## 
## Test Statistic: Chi-Squared = 131.6513
## 
## Test Statistic Parameter: df = 127
## 
## P-value: 0.3706697
## 
## 95% Confidence Interval: LCL = 3.839436
## UCL = Inf

On ne rejette donc pas l’hypothèse nulle au niveau de test 5%, la p-valeur vaut en effet environ 0.37 (elle n’est évidemment pas inférieure à 0.05).

Exemple de certificat de réussite
Exemple de certificat de réussite