• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 13/03/2024

Déterminez un intervalle de confiance sur une moyenne

Le coin méthodologique

Considérons un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$ , ou un grand échantillon i.i.d non gaussien (en pratique de taille supérieure à 30).

On va retrouver un intervalle de confiance qui fait intervenir les mêmes types de quantité :

  • La taille de l'échantillon.

  • La dispersion (empirique) de l'échantillon.

  • Des quantiles d'une loi de probabilité : pas la loi gaussienne curieusement ici mais une loi proche, celle de Student (cela est dû à la non-connaissance de la variance théorique $\(\sigma^2\)$ , pour les plus curieux on donne l'argument ci-après).

L'intervalle de confiance bilatère de niveau $\(1-\alpha\)$ pour $\(\mu\)$est alors :

$\[\left[\overline{X}-t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}} ; \overline{X}+t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}}\right]\]$

$\(t_{n-1,1-\frac{\alpha}{2}}\)$ désigne le quantile d'ordre $\(1-\frac{\alpha}{2}\)$ de la loi de Student à $\(n-1 \)$ degrés de liberté :

$\[\mathcal{T}(n-1)\]$

Rappelons que $\(S^\prime\)$ est l'écart type empirique (dans sa version non biaisée) :

$\[S^{\prime}=\sqrt{\frac{1}{n-1}\sum_{i=1}^n \left( X_{i}-\overline{X}\right) ^{2}}\]$

Pour aller plus loin

Mathématiquement, pour établir l'intervalle de confiance, on aurait pu se baser sur le résultat  probabiliste suivant :

$\[\sqrt{n} \frac{\overline{X}-\mu}{\sigma}\sim\mathcal{N}(0,1)\]$

Ce résultat est vrai pour un échantillon i.i.d gaussien, ou asymptotiquement vrai pour un grand échantillon (via le théorème de la limite centrale, le fameux TCL).

Ce résultat fait intervenir l'écart-type théorique, $\(\sigma\)$ , inconnu, l'idée est alors de remplacer cet écart-type théorique inconnu par l'empirique, $\(S^{\prime}\)$ , on obtient alors une loi de Student (à $\( n-1\)$ degrés de liberté) :

$\[\sqrt{n} \frac{\overline{X}-\mu}{S^\prime}\sim\mathcal{T}\left( n-1\right)\]$

On peut alors facilement encadrer notre statistique de la manière suivante :

$\[\mathbb{P}\left( -t_{n-1,1-\frac{\alpha}{2}}\leq\sqrt{n} \frac{\overline{X}-\mu}{S^\prime}\leq t_{n-1,1-\frac{\alpha}{2}}\right) =1-\alpha\]$

Il faut noter ici qu'on a, pour une loi de Student :

$\[-t_{n-1,\frac{\alpha}{2}}=-t_{n-1,1-\frac{\alpha}{2}}\]$

cette loi étant symétrique.

On déduit de cet encadrement le suivant (par simples équivalences) :

$\[\mathbb{P}\left( \overline{X}-t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}}\leq\mu\leq\overline{X}+t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}}\right) =1-\alpha\]$

d'où l'intervalle de confiance donné précédemment.

Le coin R : consommation d'essence

Si on souhaite encadrer la consommation d’essence moyenne (théorique) μ avec une probabilité de 95%, on obtient alors comme intervalle de confiance (  $\(t_{n-1,1-\frac{\alpha}{2}}=t_{127,0.975}\simeq 1.97\)$  et  $\(s^{\prime}\simeq 2.16\)$ )

$\[\left[31.45-1.97\ \frac{2.16}{\sqrt{128}}\ ; \ 31.45+1.97\ \frac{2.16}{\sqrt{128}}\right]\]$

Remarquons ici que l’hypothèse gaussienne n’était pas obligatoire ici, en effet l’échantillon est de taille suffisamment importante (supérieure à 30).

Si on lance “manuellement” les calculs au niveau de test 5% :

alpha <- 0.05
icinf <- xbar-qt(p=1-alpha/2,df=n_essence-1)*sprime/sqrt(n_essence)
round(icinf,digits=2)
## [1] 31.07

icsup <- xbar+qt(p=1-alpha/2,df=n_essence-1)*sprime/sqrt(n_essence)
round(icsup,digits=2)
## [1] 31.83

On obtient alors :

$\[\left[31.07\ ;\ 31.83\right]\]$

En pratique, le data analyst peut utiliser la commande  t.test  pour obtenir cet intervalle de confiance :

alpha <- 0.05
t.test(essence$conso,conf.level=1-alpha)
##
## One Sample t-test
##
## data: essence$conso
## t = 164.74, df = 127, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 31.07169 31.82722
## sample estimates:
## mean of x
## 31.44945

Exemple de certificat de réussite
Exemple de certificat de réussite