• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 08/09/2022

Découvrez les notions de covariance et de corrélation linéaire

Faites vous accompagner pour apprendre le métier de data architect avec la formation architecture big data.

Covariance de deux variables aléatoires discrètes

Espérance du produit de deux VAD

Soit (X,Y) un couple de variables aléatoires discrètes. Si la variable aléatoire XY possède une espérance, alors cette dernière est définie par :

E(XY)=xiX(Ω)yjY(Ω)xiyiP([X=xi][Y=yj])

Exemple

On reprend l'exemple du lancer de dé à 6 faces des chapitres précédents. Soit X la VAD qui vaut 1 si on obtient 6, et 0 sinon, et Y la VAD qui vaut 1 si on obtient 5, et 0 sinon.

Ces deux VAD sont de même loi. Elles suivent la loi de Bernoulli de paramètre 16 .

Ici, comme la probabilité que les deux variables prennent la valeur 1 en même temps, autrement dit P([X=1][Y=1]) , est nulle, en appliquant la définition ci-dessus pour le calcul de l'espérance de XY , on aurait ici :

 E(XY)=0

Covariance

Soit (X,Y) un couple de variables aléatoires discrètes. On appelle covariance de X et Y  le réel noté Cov(X,Y) et défini, s'il existe, par :

  Cov(X,Y)=E((XE(X))(YE(Y)))

Formule de Huygens

Si X et Y admettent une covariance, alors on a :

  Cov(X,Y)=E(XY)E(X)E(Y)

En pratique, c'est cette formule que l'on utilisera dans les exercices.

Propriétés de la covariance

Symétrie

La covariance est symétrique : Cov(X,Y)=Cov(Y,X)

Covariance et variance

 Cov(X,X) = V(X)

Bilinéarité

 Cov(aX1+bX2,Y)=aCov(X1,Y)+bCov(X2,Y)

 Cov(X,aY1+bY2)=aCov(X,Y1)+bCov(X,Y2)

Variance de la somme de deux VAD

Si X et Y sont deux VAD définies sur le même espace probabilisé et admettant des variances, alors d'une part, la covariance de X et Y existe et d'autre part, X + Y admet une variance, et on a :

  V(X+Y)=V(X)+V(Y)+2Cov(X,Y)

Corrélation

Dans cette section, nous considérons X et Y comme deux variables aléatoires discrètes admettant des variances non nulles.

On appelle coefficient de corrélation linéaire de X et Y, le réel noté ρ(X,Y) et défini par :

  ρ(X,Y)=Cov(X,Y)V(X)V(Y)

 Pour tout couple (X,Y) de variables aléatoires, on a 1ρ(X,Y]1 .

Cas de l'indépendance de deux variables aléatoires

Conséquence sur l'espérance

Si X et Y deux variables aléatoires indépendantes admettant chacune une espérance, alors la variable aléatoire XY admet également une espérance et on a :

 E(XY)=E(X)E(Y)

Conséquence sur la covariance

Si X et Y deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors   Cov(X,Y)=0 .

Ce qui peut être interprété de la manière suivante : deux VAD indépendantes ne sont pas corrélées.

La non-corrélation est une condition nécessaire, mais pas suffisante à l'indépendance.

Conséquence sur la variance

Si X et Y deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors  V(X+Y)=V(X)+V(Y) .

Et si vous obteniez un diplôme OpenClassrooms ?
  • Formations jusqu’à 100 % financées
  • Date de début flexible
  • Projets professionnalisants
  • Mentorat individuel
Trouvez la formation et le financement faits pour vous
Exemple de certificat de réussite
Exemple de certificat de réussite