• 12 hours
  • Medium

Free online content available in this course.

course.header.alt.is_video

course.header.alt.is_certifying

Got it!

Last updated on 3/13/24

Testez une proportion

Testez $\(p=p_{0}\)$ versus $\(p>p_{0}\)$

On teste :

$\[\begin{cases} H_{0}=p_{0}\\ H_{1}>p_{0} \end{cases}\]$

Choisir une statistique de test et la région critique

La forme de la zone de rejet (région critique) est $\(W=\left\{ \overline{X}-p_{0}>c\right\} \)$ : on rejettera d'autant plus facilement $\(H_{0}\)$ que $\(\overline{x}\)$ sera plus élevée que $\(p_{0}\)$. La statistique de test utilisée est $\(\overline{X}\)$.

Notons que la structure de la zone de rejet est donnée par l'hypothèse alternative $\(H_{1}\)$.

Vers un test asymptotique

Afin de déterminer $\(c\)$, on préfère considérer la loi asymptotique (continue) qu'est la loi normale (d'où le nom de test asymptotique).

On sait que si $\(\left( X_{1},\ldots,X_{n}\right) \)$ est un échantillon i.i.d de loi $\(\mathcal{B}\left( p_{0}\right) \)$, le théorème de la limite centrale indique que :

$\[\sqrt{n}\dfrac{\overline{X}-p_{0}}{\sqrt{p_{0}\left( 1-p_{0}\right) }}\xrightarrow{\mathcal{L}}\mathcal{N}\left( 0,1\right) \]$

Cette approximation n'est utilisée en pratique que si $\(np_{0}\left(1-p_{0}\right) \geq5\)$ .

Sous cette condition, qui nous conduit à considérer ici un test dit asymptotique, on obtient après calculs :

$\[c=\Phi_{1-\alpha}\sqrt{\dfrac{p_{0}\left( 1-p_{0}\right) }{n}} \]$

La règle de décision

Les décisions prises sont, avec un niveau de test égal à $\(\alpha\)$ :

  • le rejet de $\(H_{0}\)$ si $\(\overline{x}>p_{0}+\Phi_{1-\alpha}\sqrt{\frac{p_{0}\left( 1-p_{0}\right) }{n}}\)$ ,

  • le non-rejet de $\(H_{0}\)$ si $\(\overline{x}\leq p_{0}+\Phi_{1-\alpha}\sqrt{\frac{p_{0}\left( 1-p_{0}\right) }{n}}\)$ .

Remarquons que :

  • La constante est positive : $\(c\geq 0\)$ .
    On retrouve notre considération introductive selon laquelle si $\(\overline {x}\leq p_{0}\)$, on ne rejette pas l'hypothèse nulle (et donc l'ancien médicament est conservé). Il en est encore ainsi si $\(\overline {x}\)$ est "trop peu supérieur" à $\(p_{0}\)$. C'est si $\(\overline {x}\)$ est "significativement supérieur" à $\(p_{0}\)$ au niveau de test $\(\alpha\)$, d'au moins $\(\phi_{1-\alpha}\sqrt{\frac{p_{0}(1-p_{0})}{n}}\)$, que l'on rejette l'hypothèse nulle, le nouveau médicament semble alors préférable à l'ancien.

  • La constante $\(c\)$ décroît lorsque la taille de l'échantillon $\(n\)$ croît .
    A $\(\alpha\)$ fixé, une même proportion observée $\(\overline{x}>p_{0}\)$, jugée non significativement supérieure à $\(p_{0}\)$ si elle est issue d'un échantillon d'assez petite taille, le deviendra nécessairement pour des tailles suffisamment élevées, c'est-à-dire pour $\(n>\phi_{1-\alpha}^{2} \frac{ p_{0}\left(1-p_{0}\right)}{(\overline{x}-p_{0})^{2} }\)$.

  • La constante $\(c\)$ décroît lorsque le niveau de test $\(\alpha\)$ croît
    On sait que $\(\Phi_{1-\alpha}\)$ décroît lorsque $\(\alpha\)$ croît.
    A $\(n\)$ fixé, une même valeur de $\(\overline {x}\)$ peut conduire à rejeter l'hypothèse si $\(\alpha\)$ est assez fort (test "peu sévère") et ne pas la rejeter si $\(\alpha\)$ est assez faible (test "sévère").

Utiliser la p-valeur

On peut mettre en évidence la p-valeur du test :

$\[\operatorname{p-valeur}=1-\Phi\left( \sqrt{n}\dfrac{\overline{x}-p_{0}}{\sqrt{p_{0}\left(1-p_{0}\right) }}\right)\]$

 La procédure de décision consiste donc à se fixer un niveau de test $\(\alpha\)$ et à calculer la p-valeur. Les décisions prises sont alors :

  • le rejet de $\(H_{0}\)$ si $\(\operatorname{p-valeur}<\alpha\)$ ,

  • le non-rejet de $\(H_{0}\)$ si $\(\operatorname{p-valeur}\geq\alpha\)$ .

Le schéma suivant nous permet de visualiser la p-valeur :

Testez $\(p=p_{0}\)$  versus $\(p\ne p_{0}\)$

Si on considère cette fois le test alternatif suivant :

$\[\begin{cases} H_{0}=p_{0}\\ H_{1}\ne p_{0} \end{cases}\]$

on choisit comme région critique $\(W=\left\{\left\vert\overline{X}-p_{0}\right\vert>c\right\}\)$.
On constate que la région critique intègre cette fois une valeur absolue afin de tenir compte du fait que $\(p\ne p_{0}\)$ regroupe les cas $\(p\geq p_{0}\)$ ET $\(p\leq p_{0}\)$.

La résolution mathématique conduit à :

$\[c=\Phi_{1-\frac{\alpha}{2}}\sqrt{\frac{p_{0}\left(1-p_{0}\right) }{n}}\]$

On trouve ici $\(\Phi_{1-\frac{\alpha}{2}}\)$ à la place de $\(\Phi_{1-\alpha}\)$ dans le test unilatère précédent (celui du premier exemple introductif).

Les décisions prises sont, au niveau de test $\(\alpha\)$ :

  • le rejet de $\(H_{0}\)$ si $\(\left\vert\overline{x}-p_{0}\right\vert>\Phi_{1-\frac{\alpha}{2}}\sqrt{\frac{p_{0}\left( 1-p_{0}\right) }{n}}\)$

  • le non-rejet de $\(H_{0}\)$ si $\(\left\vert\overline{x}-p_{0}\right\vert\leq\Phi_{1-\frac{\alpha}{2}}\sqrt{\frac{p_{0}\left( 1-p_{0}\right) }{n}}\)$

Et il est encore possible de calculer la p-valeur.

Le coin R : exemple du taux de guérison

On teste :

$\[\begin{cases}H_{0} =p_{0}\\H_{1} >p_{0}\end{cases}\]$

avec $\(p_0 = 0.75\)$ .

On considère que l’hypothèse gaussienne est acceptable ici, en effet :

$\[np_{0}\left(1-p_{0}\right)=216\, (0.75)\,(1-0.75)=40.5>;5\ .\]$

Pour $\(\alpha = 5%\)$ , on a :

  •  $\(\Phi_{1-\alpha}\simeq1.64\)$

  •  $\(p_{0}+\Phi_{1-\alpha}\sqrt{\frac{p_{0}\left( 1-p_{0}\right) }{n}}\simeq0.798\)$

On ne rejette pas $\(H_0\)$ au niveau de test 5% car :

$\[\overline{x}=0.773\leq0.798\simeq p_{0}+\Phi_{1-\alpha}\sqrt{\frac{p_{0}\left( 1-p_{0}\right) }{n}}\ .\]$

La p-valeur vaut :

$\[\operatorname{p-valeur}=1-\Phi\left( \sqrt{n}\dfrac{\overline{x}-p_{0}}{\sqrt{p_{0}\left( 1-p_{0}\right) }}\right) \simeq1-\Phi\left(0.786\right) \simeq0.216\ .\]$

On constate que le niveau de test retenu devrait au moins être égal à 21,6% pour rejeter $\(H_0\)$ ! Accepter de se tromper dans plus de 20% des cas lorsque rejette l’hypothèse nulle n’est pas rencontré en pratique.

Au final, le laboratoire ne peut pas conclure avec un niveau de test raisonnable que le nouveau médicament est meilleur que celui déjà sur le marché.

Dans R, on utilise de nouveau la commande  prop.test  :

prop.test(x=167,n=216,p=0.75,alternative="greater")
## 
## Results of Hypothesis Test
## --------------------------
## 
## Null Hypothesis: p = 0.75
## 
## Alternative Hypothesis: True p is greater than 0.75
## 
## Test Name: 1-sample proportions test with continuity correction
## 
## Estimated Parameter(s): p = 0.7731481
## 
## Data: 167 out of 216, null probability 0.75
## 
## Test Statistic: X-squared = 0.5
## 
## Test Statistic Parameter: df = 1
## 
## P-value: 0.2397501
## 
## 95% Confidence Interval: LCL = 0.7206161
## UCL = 1.0000000

Example of certificate of achievement
Example of certificate of achievement