• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 13/03/2024

Déterminez un intervalle de confiance sur une variance

Le coin méthodologique

Considérons un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$, ou un grand échantillon i.i.d non gaussien (en pratique de taille supérieure à 30).

L'intervalle de confiance bilatère de niveau $\(1-\alpha\)$ pour $\(\sigma^{2}\)$ est alors :

$\[\left[\frac{\left( n-1\right) S^{\prime 2}}{\chi_{n-1,1-\frac{\alpha}{2}}^{2}} ; \frac{\left( n-1\right) S^{\prime 2}}{\chi_{n-1,\frac{\alpha}{2}}^{2}}\right]\]$

$\(\chi_{n-1,\frac{\alpha}{2}}^{2}\)$ et $\(\chi_{n-1,1-\frac{\alpha}{2}}^{2}\)$ désignent respectivement les quantiles d'ordres $\(\frac{\alpha}{2}\)$ et $\(1-\frac{\alpha}{2}\)$ de la loi $\(\chi^2(n-1)\)$

Pour aller plus loin

Mathématiquement, pour établir l'intervalle de confiance, on se base sur le résultat probabiliste suivant :

$\[\left( n-1\right) \frac{S^{\prime 2}}{\sigma^2}\sim\chi^{2}(n-1)\]$

Ce résultat est vrai pour un échantillon i.i.d sous hypothèse normale, ou asymptotiquement vrai pour un grand échantillon i.i.d quelconque.

Le coin R : exemple de la consommation d'essence

Si on souhaite encadrer la variance (théorique) de la consommation d’essence $\(\sigma^2\)$ avec une probabilité de 95%, on obtient alors comme intervalle de confiance (  $\(\chi_{n-1,\frac{\alpha}{2}}^{2}=\chi_{127,0.025}^{2}\simeq 97.7\)$$\(\chi_{n-1,\frac{\alpha}{2}}^{2}=\chi_{127,0.975}^{2}\simeq 160.1\)$ et  $\(s^{\prime 2}\simeq 4.66\)$ ) :

$\[\left[\frac{127\times 4.66}{160.1}\ ;\ \frac{127\times 4.66}{97.7}\right]\]$

Si on lance “manuellement” les calculs au niveau de test 5% :

alpha <- 0.05
icinf <- (n_essence-1)*sprime2/qchisq(p=1-alpha/2,df=n_essence-1)
round(icinf,digits=2)
## [1] 3.7

icsup <- (n_essence-1)*sprime2/qchisq(p=alpha/2,df=n_essence-1)
round(icsup,digits=2)
## [1] 6.06

On obtient alors :

Remarquons encore ici que l’hypothèse gaussienne n’était pas obligatoire ici, en effet l’échantillon est de taille suffisamment importante (supérieure à 30).

En pratique, le data analyst pourra utiliser la commande  varTest  issue du package  EnvStats  pour obtenir cet intervalle de confiance :

$\[\left[3.70\ ;\ 6.06\right]\]$

library(EnvStats)
## 
## Attaching package: 'EnvStats'

## The following objects are masked from 'package:stats':
## 
## predict, predict.lm

## The following object is masked from 'package:base':
## 
## print.default
alpha <- 0.05
varTest(essence$conso,conf.level=1-alpha)
## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: variance = 1
## 
## Alternative Hypothesis: True variance is not equal to 1
## 
## Test Name: Chi-Squared Test on Variance
## 
## Estimated Parameter(s): variance = 4.66481
## 
## Data: essence$conso
## 
## Test Statistic: Chi-Squared = 592.4309
## 
## Test Statistic Parameter: df = 127
## 
## P-value: 0
## 
## 95% Confidence Interval: LCL = 3.700708
## UCL = 6.063869

Exemple de certificat de réussite
Exemple de certificat de réussite