• 12 hours
  • Medium

Free online content available in this course.

course.header.alt.is_video

course.header.alt.is_certifying

Got it!

Last updated on 3/13/24

Découvrez les tests statistiques

Nous passons maintenant à la réponse à la troisième question, à laquelle nous répondons grâce aux tests statistiques.

Cas du taux de guérison

Le laboratoire cherche à savoir si la nouvelle composition du médicament présente un taux de guérison meilleur que le précédent. Il considère a priori que son efficacité est similaire au précédent médicament et ne prendra la responsabilité de proposer la nouvelle composition que si le nouveau taux de guérison s'avère être significativement supérieur à celui de l'ancien médicament $\(p_{0}=0.75\)$.

Son a priori correspond à ce qu'on appellera l'hypothèse nulle, notée $\(H_{0}\)$. Quant à l'autre hypothèse, l'alternative, notée $\(H_{1}\)$, elle permet d'indiquer dans quel cas de figure on rejettera cet a priori.

On considère donc ici le test suivant :

$\[\begin{cases} H_{0}=0.75\\ H_{1}>0.75 \end{cases}\]$

L'hypothèse $\(p=p_{0}\)$ paraît intuitivement d'autant moins crédible que $\(\overline {x}\)$, proportion de guérison, est plus forte. Quand $\(\overline{x}\)$ sera jugé "suffisamment plus élevé" que $\(p_{0}\)$ (significativement supérieur à $\(p_{0}\)$), le laboratoire pourra rejeter l'hypothèse $\(p=p_{0}\)$.

C'est le rejet de $\(H_0\)$ qui, s'il est fait à mauvais escient, sera considéré comme le plus coûteux pour le laboratoire, car ayant des répercussions humaines et économiques néfastes : on parle de risque de première espèce.

En pratique on recherche la valeur $\(c\)$ ($\(\geq 0\)$) telle qu'on rejettera l'hypothèse nulle si :

$\[\overline{X}>p_{0}+c\]$

c'est-à-dire quand la proportion de guérison observée est "vraiment" supérieure à $\(p_{0}\)$.

Pour fixer ce seuil $\(c\)$ qui détermine la région de rejet, le data analyst doit demander au laboratoire de fixer une borne supérieure à la probabilité qu'il juge tolérable pour ce rejet à mauvais escient : le niveau de test.

Ensuite, sous cette contrainte, on cherchera à choisir $\(c\)$ de manière à minimiser la probabilité de non-rejet de $\(H_0\)$ à mauvais escient : le risque de seconde espèce.

Cas de la consommation d'essence

Le fabricant de cars souhaite communiquer sur une consommation moyenne (théorique) d'essence égale à $\(\mu_0=31\)$ litres aux 100. Il ne souhaite pas sous-estimer ou sur-estimer cette valeur seuil.
De la même manière que précédemment, on considère le test :

$\[\begin{cases} H_{0}:\mu=\mu_{0}\\ H_{1}:\mu\ne\mu_{0} \end{cases}\]$

Ce test est dit bilatère car il existe deux motifs de rejet de son hypothèse de travail.

L'hypothèse $\(\mu=\mu_{0}\)$ paraît intuitivement d'autant moins crédible que $\(\overline {x}\)$, consommation moyenne observée sur son échantillon, est jugé "suffisamment différente" de $\(\mu_0\)$ (significativement inférieure ou supérieure à $\(\mu_0\)$). C'est toujours ce rejet qui, s'il est fait à mauvais escient, sera considéré comme plus coûteux pour le constructeur...

On pratique on recherche la valeur $\(c>0\)$ telle qu'on rejette l'hypothèse nulle si :

$\[\left\vert\overline{x}-\mu_0\right\vert>c\]$

c'est-à-dire si la consommation d'essence moyenne observée est "vraiment différente" de $\(\mu_0\)$.

Pour fixer ce seuil $\(c\)$ qui détermine la région de rejet, le data analyst doit là-encore demander au constructeur de fixer une borne supérieure pour son risque de première espèce, celui de rejeter à tort son a priori.

Example of certificate of achievement
Example of certificate of achievement