Le data analyst va pouvoir apporter des réponses à chacune de ces questions, en ayant posé au préalable un modèle probabiliste (on reviendra sur les raisons de cette hypothèse dans la suite), discret dans le premier exemple, continu dans le second exemple.
A la première question, le data analyst donnera comme réponse une estimation (ponctuelle)
— du taux de guérison théorique p dans le premier exemple.
— de la consommation d’essence théorique μ dans le second exemple (on peut vouloir aussi estimer la dispersion de cette consommation σ2 ).La réponse apportée à la seconde question sera un intervalle de confiance.
Enfin pour répondre à la troisième question, il mettra en place un test statistique pour vérifier que :
— p>p0 , avec p0=0.75 , dans le premier exemple,
— μ=μ0 , avec μ0=31 , dans le second exemple.
Globalement, le data analyst apporte des outils d’aide à la décision, enjeu crucial dans de nombreux domaines aujourd’hui.