• 12 hours
  • Medium

Free online content available in this course.

course.header.alt.is_video

course.header.alt.is_certifying

Got it!

Last updated on 9/5/19

Déterminez un intervalle de confiance sur une moyenne

Log in or subscribe for free to enjoy all this course has to offer!

Le coin méthodologique

Considérons un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$ , ou un grand échantillon i.i.d non gaussien (en pratique de taille supérieure à 30).

On va retrouver un intervalle de confiance qui fait intervenir les mêmes types de quantité :

  • La taille de l'échantillon.

  • La dispersion (empirique) de l'échantillon.

  • Des quantiles d'une loi de probabilité : pas la loi gaussienne curieusement ici mais une loi proche, celle de Student (cela est dû à la non-connaissance de la variance théorique $\(\sigma^2\)$ , pour les plus curieux on donne l'argument ci-après).

L'intervalle de confiance bilatère de niveau $\(1-\alpha\)$ pour $\(\mu\)$est alors :

$\[\left[\overline{X}-t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}} ; \overline{X}+t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}}\right]\]$

$\(t_{n-1,1-\frac{\alpha}{2}}\)$ désigne le quantile d'ordre $\(1-\frac{\alpha}{2}\)$ de la loi de Student à $\(n-1 \)$ degrés de liberté :

$\[\mathcal{T}(n-1)\]$

Rappelons que $\(S^\prime\)$ est l'écart type empirique (dans sa version non biaisée) :

$\[S^{\prime}=\sqrt{\frac{1}{n-1}\sum_{i=1}^n \left( X_{i}-\overline{X}\right) ^{2}}\]$

Pour aller plus loin

Mathématiquement, pour établir l'intervalle de confiance, on aurait pu se baser sur le résultat  probabiliste suivant :

$\[\sqrt{n} \frac{\overline{X}-\mu}{\sigma}\sim\mathcal{N}(0,1)\]$

Ce résultat est vrai pour un échantillon i.i.d gaussien, ou asymptotiquement vrai pour un grand échantillon (via le théorème de la limite centrale, le fameux TCL).

Ce résultat fait intervenir l'écart-type théorique, $\(\sigma\)$ , inconnu, l'idée est alors de remplacer cet écart-type théorique inconnu par l'empirique, $\(S^{\prime}\)$ , on obtient alors une loi de Student (à $\( n-1\)$ degrés de liberté) :

$\[\sqrt{n} \frac{\overline{X}-\mu}{S^\prime}\sim\mathcal{T}\left( n-1\right)\]$

On peut alors facilement encadrer notre statistique de la manière suivante :

$\[\mathbb{P}\left( -t_{n-1,1-\frac{\alpha}{2}}\leq\sqrt{n} \frac{\overline{X}-\mu}{S^\prime}\leq t_{n-1,1-\frac{\alpha}{2}}\right) =1-\alpha\]$

Il faut noter ici qu'on a, pour une loi de Student :

$\[-t_{n-1,\frac{\alpha}{2}}=-t_{n-1,1-\frac{\alpha}{2}}\]$

cette loi étant symétrique.

On déduit de cet encadrement le suivant (par simples équivalences) :

$\[\mathbb{P}\left( \overline{X}-t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}}\leq\mu\leq\overline{X}+t_{n-1,1-\frac{\alpha}{2}} \frac{S^\prime}{\sqrt{n}}\right) =1-\alpha\]$

d'où l'intervalle de confiance donné précédemment.

Le coin R : consommation d'essence

Si on souhaite encadrer la consommation d’essence moyenne (théorique) μ avec une probabilité de 95%, on obtient alors comme intervalle de confiance (  $\(t_{n-1,1-\frac{\alpha}{2}}=t_{127,0.975}\simeq 1.97\)$  et  $\(s^{\prime}\simeq 2.16\)$ )

$\[\left[31.45-1.97\ \frac{2.16}{\sqrt{128}}\ ; \ 31.45+1.97\ \frac{2.16}{\sqrt{128}}\right]\]$

Remarquons ici que l’hypothèse gaussienne n’était pas obligatoire ici, en effet l’échantillon est de taille suffisamment importante (supérieure à 30).

Si on lance “manuellement” les calculs au niveau de test 5% :

alpha <- 0.05
icinf <- xbar-qt(p=1-alpha/2,df=n_essence-1)*sprime/sqrt(n_essence)
round(icinf,digits=2)
## [1] 31.07

icsup <- xbar+qt(p=1-alpha/2,df=n_essence-1)*sprime/sqrt(n_essence)
round(icsup,digits=2)
## [1] 31.83

On obtient alors :

$\[\left[31.07\ ;\ 31.83\right]\]$

En pratique, le data analyst peut utiliser la commande  t.test  pour obtenir cet intervalle de confiance :

alpha <- 0.05
t.test(essence$conso,conf.level=1-alpha)
##
## One Sample t-test
##
## data: essence$conso
## t = 164.74, df = 127, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 31.07169 31.82722
## sample estimates:
## mean of x
## 31.44945

Example of certificate of achievement
Example of certificate of achievement