Testez p=p0 versus p>p0
On teste :
Choisir une statistique de test et la région critique
La forme de la zone de rejet (région critique) est W={¯X−p0>c} : on rejettera d'autant plus facilement H0 que ¯x sera plus élevée que p0. La statistique de test utilisée est ¯X.
Notons que la structure de la zone de rejet est donnée par l'hypothèse alternative H1.
Vers un test asymptotique
Afin de déterminer c, on préfère considérer la loi asymptotique (continue) qu'est la loi normale (d'où le nom de test asymptotique).
On sait que si (X1,…,Xn) est un échantillon i.i.d de loi B(p0), le théorème de la limite centrale indique que :
Cette approximation n'est utilisée en pratique que si np0(1−p0)≥5 .
Sous cette condition, qui nous conduit à considérer ici un test dit asymptotique, on obtient après calculs :
La règle de décision
Les décisions prises sont, avec un niveau de test égal à α :
le rejet de H0 si ¯x>p0+Φ1−α√p0(1−p0)n ,
le non-rejet de H0 si ¯x≤p0+Φ1−α√p0(1−p0)n .
Remarquons que :
La constante est positive : c≥0 .
On retrouve notre considération introductive selon laquelle si ¯x≤p0, on ne rejette pas l'hypothèse nulle (et donc l'ancien médicament est conservé). Il en est encore ainsi si ¯x est "trop peu supérieur" à p0. C'est si ¯x est "significativement supérieur" à p0 au niveau de test α, d'au moins ϕ1−α√p0(1−p0)n, que l'on rejette l'hypothèse nulle, le nouveau médicament semble alors préférable à l'ancien.La constante c décroît lorsque la taille de l'échantillon n croît .
A α fixé, une même proportion observée ¯x>p0, jugée non significativement supérieure à p0 si elle est issue d'un échantillon d'assez petite taille, le deviendra nécessairement pour des tailles suffisamment élevées, c'est-à-dire pour n>ϕ21−αp0(1−p0)(¯x−p0)2.La constante c décroît lorsque le niveau de test α croît
On sait que Φ1−α décroît lorsque α croît.
A n fixé, une même valeur de ¯x peut conduire à rejeter l'hypothèse si α est assez fort (test "peu sévère") et ne pas la rejeter si α est assez faible (test "sévère").
Utiliser la p-valeur
On peut mettre en évidence la p-valeur du test :
La procédure de décision consiste donc à se fixer un niveau de test α et à calculer la p-valeur. Les décisions prises sont alors :
le rejet de H0 si p-valeur<α ,
le non-rejet de H0 si p-valeur≥α .
Le schéma suivant nous permet de visualiser la p-valeur :
Testez p=p0 versus p≠p0
Si on considère cette fois le test alternatif suivant :
on choisit comme région critique W={|¯X−p0|>c}.
On constate que la région critique intègre cette fois une valeur absolue afin de tenir compte du fait que p≠p0 regroupe les cas p≥p0 ET p≤p0.
La résolution mathématique conduit à :
On trouve ici Φ1−α2 à la place de Φ1−α dans le test unilatère précédent (celui du premier exemple introductif).
Les décisions prises sont, au niveau de test α :
le rejet de H0 si |¯x−p0|>Φ1−α2√p0(1−p0)n
le non-rejet de H0 si |¯x−p0|≤Φ1−α2√p0(1−p0)n
Et il est encore possible de calculer la p-valeur.
Le coin R : exemple du taux de guérison
On teste :
avec p0=0.75 .
On considère que l’hypothèse gaussienne est acceptable ici, en effet :
Pour α=5 , on a :
Φ1−α≃1.64
p0+Φ1−α√p0(1−p0)n≃0.798
On ne rejette pas H0 au niveau de test 5% car :
La p-valeur vaut :
On constate que le niveau de test retenu devrait au moins être égal à 21,6% pour rejeter H0 ! Accepter de se tromper dans plus de 20% des cas lorsque rejette l’hypothèse nulle n’est pas rencontré en pratique.
Au final, le laboratoire ne peut pas conclure avec un niveau de test raisonnable que le nouveau médicament est meilleur que celui déjà sur le marché.
Dans R, on utilise de nouveau la commande prop.test
:
prop.test(x=167,n=216,p=0.75,alternative="greater")
## ## Results of Hypothesis Test ## -------------------------- ## ## Null Hypothesis: p = 0.75 ## ## Alternative Hypothesis: True p is greater than 0.75 ## ## Test Name: 1-sample proportions test with continuity correction ## ## Estimated Parameter(s): p = 0.7731481 ## ## Data: 167 out of 216, null probability 0.75 ## ## Test Statistic: X-squared = 0.5 ## ## Test Statistic Parameter: df = 1 ## ## P-value: 0.2397501 ## ## 95% Confidence Interval: LCL = 0.7206161 ## UCL = 1.0000000