On passe maintenant à la réponse à la deuxième question, grâce aux intervalles de confiance !
L'idée
On a vu précédemment que l'estimation d'un paramètre θ peut différer selon l'échantillon qu'on va considérer. Cet estimateur ˆθ est bel et bien une variable aléatoire qui tombe "autour" de θ mais rarement sur sa "vraie" valeur.
Mathématiquement
Cette fois, on cherche une estimation du paramètre θ dans un intervalle de confiance, une fourchette dont on connaîtra la probabilité.
On cherche donc à déterminer les bornes d'un intervalle, dépendantes de l'échantillon, notées IC−(X1,…,Xn) et IC+(X1,…,Xn) , telles que la probabilité que le paramètre soit à l'intérieur soit dans cet intervalle, soit connue, égale à 1−α :
1−α∈]0,1[ désigne le niveau de confiance de l'intervalle.
Tel qu'écrit, il s'agit d'un intervalle de confiance bilatère (on encadre le paramètre à gauche ET à droite), il est également possible de construire un intervalle unilatère (on encadre le paramètre à gauche OU à droite).
On se trouve toujours face à un dilemme : pour garantir le niveau de confiance, l'intervalle ne doit pas être trop étroit mais, pour être pratiquement utilisable, il ne doit pas être trop large. On cherche donc des intervalles aussi étroits que possible, au niveau de confiance 1−α imposé, et ce uniformément en θ , d'où la difficulté du problème.
Classiquement on considère des intervalles de confiance de niveaux 90% ( α=10 ) ou 95% ( α=5 ).