• 12 hours
  • Medium

Free online content available in this course.

course.header.alt.is_video

course.header.alt.is_certifying

Got it!

Last updated on 9/5/19

Déterminez un intervalle de confiance sur une variance

Log in or subscribe for free to enjoy all this course has to offer!

Le coin méthodologique

Considérons un échantillon i.i.d de loi $\(\mathcal{N}\left(\mu,\sigma^2\right)\)$, ou un grand échantillon i.i.d non gaussien (en pratique de taille supérieure à 30).

L'intervalle de confiance bilatère de niveau $\(1-\alpha\)$ pour $\(\sigma^{2}\)$ est alors :

$\[\left[\frac{\left( n-1\right) S^{\prime 2}}{\chi_{n-1,1-\frac{\alpha}{2}}^{2}} ; \frac{\left( n-1\right) S^{\prime 2}}{\chi_{n-1,\frac{\alpha}{2}}^{2}}\right]\]$

$\(\chi_{n-1,\frac{\alpha}{2}}^{2}\)$ et $\(\chi_{n-1,1-\frac{\alpha}{2}}^{2}\)$ désignent respectivement les quantiles d'ordres $\(\frac{\alpha}{2}\)$ et $\(1-\frac{\alpha}{2}\)$ de la loi $\(\chi^2(n-1)\)$

Pour aller plus loin

Mathématiquement, pour établir l'intervalle de confiance, on se base sur le résultat probabiliste suivant :

$\[\left( n-1\right) \frac{S^{\prime 2}}{\sigma^2}\sim\chi^{2}(n-1)\]$

Ce résultat est vrai pour un échantillon i.i.d sous hypothèse normale, ou asymptotiquement vrai pour un grand échantillon i.i.d quelconque.

Le coin R : exemple de la consommation d'essence

Si on souhaite encadrer la variance (théorique) de la consommation d’essence $\(\sigma^2\)$ avec une probabilité de 95%, on obtient alors comme intervalle de confiance (  $\(\chi_{n-1,\frac{\alpha}{2}}^{2}=\chi_{127,0.025}^{2}\simeq 97.7\)$$\(\chi_{n-1,\frac{\alpha}{2}}^{2}=\chi_{127,0.975}^{2}\simeq 160.1\)$ et  $\(s^{\prime 2}\simeq 4.66\)$ ) :

$\[\left[\frac{127\times 4.66}{160.1}\ ;\ \frac{127\times 4.66}{97.7}\right]\]$

Si on lance “manuellement” les calculs au niveau de test 5% :

alpha <- 0.05
icinf <- (n_essence-1)*sprime2/qchisq(p=1-alpha/2,df=n_essence-1)
round(icinf,digits=2)
## [1] 3.7

icsup <- (n_essence-1)*sprime2/qchisq(p=alpha/2,df=n_essence-1)
round(icsup,digits=2)
## [1] 6.06

On obtient alors :

Remarquons encore ici que l’hypothèse gaussienne n’était pas obligatoire ici, en effet l’échantillon est de taille suffisamment importante (supérieure à 30).

En pratique, le data analyst pourra utiliser la commande  varTest  issue du package  EnvStats  pour obtenir cet intervalle de confiance :

$\[\left[3.70\ ;\ 6.06\right]\]$

library(EnvStats)
## 
## Attaching package: 'EnvStats'

## The following objects are masked from 'package:stats':
## 
## predict, predict.lm

## The following object is masked from 'package:base':
## 
## print.default
alpha <- 0.05
varTest(essence$conso,conf.level=1-alpha)
## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: variance = 1
## 
## Alternative Hypothesis: True variance is not equal to 1
## 
## Test Name: Chi-Squared Test on Variance
## 
## Estimated Parameter(s): variance = 4.66481
## 
## Data: essence$conso
## 
## Test Statistic: Chi-Squared = 592.4309
## 
## Test Statistic Parameter: df = 127
## 
## P-value: 0
## 
## 95% Confidence Interval: LCL = 3.700708
## UCL = 6.063869

Example of certificate of achievement
Example of certificate of achievement