Testez versus
On teste :
Choisir une statistique de test et la région critique
La forme de la zone de rejet (région critique) est : on rejettera d'autant plus facilement que sera plus élevée que . La statistique de test utilisée est .
Notons que la structure de la zone de rejet est donnée par l'hypothèse alternative .
Vers un test asymptotique
Afin de déterminer , on préfère considérer la loi asymptotique (continue) qu'est la loi normale (d'où le nom de test asymptotique).
On sait que si est un échantillon i.i.d de loi , le théorème de la limite centrale indique que :
Cette approximation n'est utilisée en pratique que si .
Sous cette condition, qui nous conduit à considérer ici un test dit asymptotique, on obtient après calculs :
La règle de décision
Les décisions prises sont, avec un niveau de test égal à :
le rejet de si ,
le non-rejet de si .
Remarquons que :
La constante est positive : .
On retrouve notre considération introductive selon laquelle si , on ne rejette pas l'hypothèse nulle (et donc l'ancien médicament est conservé). Il en est encore ainsi si est "trop peu supérieur" à . C'est si est "significativement supérieur" à au niveau de test , d'au moins , que l'on rejette l'hypothèse nulle, le nouveau médicament semble alors préférable à l'ancien.La constante décroît lorsque la taille de l'échantillon croît .
A fixé, une même proportion observée , jugée non significativement supérieure à si elle est issue d'un échantillon d'assez petite taille, le deviendra nécessairement pour des tailles suffisamment élevées, c'est-à-dire pour .La constante décroît lorsque le niveau de test croît
On sait que décroît lorsque croît.
A fixé, une même valeur de peut conduire à rejeter l'hypothèse si est assez fort (test "peu sévère") et ne pas la rejeter si est assez faible (test "sévère").
Utiliser la p-valeur
On peut mettre en évidence la p-valeur du test :
La procédure de décision consiste donc à se fixer un niveau de test et à calculer la p-valeur. Les décisions prises sont alors :
le rejet de si ,
le non-rejet de si .
Le schéma suivant nous permet de visualiser la p-valeur :
Testez versus
Si on considère cette fois le test alternatif suivant :
on choisit comme région critique .
On constate que la région critique intègre cette fois une valeur absolue afin de tenir compte du fait que regroupe les cas ET .
La résolution mathématique conduit à :
On trouve ici à la place de dans le test unilatère précédent (celui du premier exemple introductif).
Les décisions prises sont, au niveau de test :
le rejet de si
le non-rejet de si
Et il est encore possible de calculer la p-valeur.
Le coin R : exemple du taux de guérison
On teste :
avec .
On considère que l’hypothèse gaussienne est acceptable ici, en effet :
Pour , on a :
On ne rejette pas au niveau de test 5% car :
La p-valeur vaut :
On constate que le niveau de test retenu devrait au moins être égal à 21,6% pour rejeter ! Accepter de se tromper dans plus de 20% des cas lorsque rejette l’hypothèse nulle n’est pas rencontré en pratique.
Au final, le laboratoire ne peut pas conclure avec un niveau de test raisonnable que le nouveau médicament est meilleur que celui déjà sur le marché.
Dans R, on utilise de nouveau la commande prop.test
:
prop.test(x=167,n=216,p=0.75,alternative="greater")
## ## Results of Hypothesis Test ## -------------------------- ## ## Null Hypothesis: p = 0.75 ## ## Alternative Hypothesis: True p is greater than 0.75 ## ## Test Name: 1-sample proportions test with continuity correction ## ## Estimated Parameter(s): p = 0.7731481 ## ## Data: 167 out of 216, null probability 0.75 ## ## Test Statistic: X-squared = 0.5 ## ## Test Statistic Parameter: df = 1 ## ## P-value: 0.2397501 ## ## 95% Confidence Interval: LCL = 0.7206161 ## UCL = 1.0000000