Faites vous accompagner pour apprendre le métier de data architect avec la formation architecture big data.
Covariance de deux variables aléatoires discrètes
Espérance du produit de deux VAD
Soit un couple de variables aléatoires discrètes. Si la variable aléatoire possède une espérance, alors cette dernière est définie par :
Exemple
On reprend l'exemple du lancer de dé à 6 faces des chapitres précédents. Soit X la VAD qui vaut 1 si on obtient 6, et 0 sinon, et Y la VAD qui vaut 1 si on obtient 5, et 0 sinon.
Ces deux VAD sont de même loi. Elles suivent la loi de Bernoulli de paramètre .
Ici, comme la probabilité que les deux variables prennent la valeur 1 en même temps, autrement dit , est nulle, en appliquant la définition ci-dessus pour le calcul de l'espérance de , on aurait ici :
Covariance
Soit un couple de variables aléatoires discrètes. On appelle covariance de et le réel noté et défini, s'il existe, par :
Formule de Huygens
Si X et Y admettent une covariance, alors on a :
En pratique, c'est cette formule que l'on utilisera dans les exercices.
Propriétés de la covariance
Symétrie
La covariance est symétrique :
Covariance et variance
=
Bilinéarité
Variance de la somme de deux VAD
Si X et Y sont deux VAD définies sur le même espace probabilisé et admettant des variances, alors d'une part, la covariance de X et Y existe et d'autre part, X + Y admet une variance, et on a :
Corrélation
Dans cette section, nous considérons X et Y comme deux variables aléatoires discrètes admettant des variances non nulles.
On appelle coefficient de corrélation linéaire de X et Y, le réel noté et défini par :
Pour tout couple (X,Y) de variables aléatoires, on a .
Cas de l'indépendance de deux variables aléatoires
Conséquence sur l'espérance
Si et deux variables aléatoires indépendantes admettant chacune une espérance, alors la variable aléatoire admet également une espérance et on a :
Conséquence sur la covariance
Si et deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors .
Ce qui peut être interprété de la manière suivante : deux VAD indépendantes ne sont pas corrélées.
La non-corrélation est une condition nécessaire, mais pas suffisante à l'indépendance.
Conséquence sur la variance
Si et deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors .