• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 25/04/2019

Découvrez les notions de covariance et de corrélation linéaire

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Faites vous accompagner pour apprendre le métier de data architect avec la formation architecture big data.

Covariance de deux variables aléatoires discrètes

Espérance du produit de deux VAD

Soit $\( (X, Y)\)$ un couple de variables aléatoires discrètes. Si la variable aléatoire $\(XY \)$ possède une espérance, alors cette dernière est définie par :

$\(\mathbb{E}(XY) = \sum_{x_i \in X(\Omega) y_j \in Y(\Omega)}{x_i y_i \mathbb{P}([X = x_i] \cap [Y = y_j])}\)$

Exemple

On reprend l'exemple du lancer de dé à 6 faces des chapitres précédents. Soit X la VAD qui vaut 1 si on obtient 6, et 0 sinon, et Y la VAD qui vaut 1 si on obtient 5, et 0 sinon.

Ces deux VAD sont de même loi. Elles suivent la loi de Bernoulli de paramètre $\(\frac{1}{6}\)$ .

Ici, comme la probabilité que les deux variables prennent la valeur 1 en même temps, autrement dit $\(\mathbb{P}([X=1]\)$$\(\cap [Y=1])\)$ , est nulle, en appliquant la définition ci-dessus pour le calcul de l'espérance de $\(XY\)$ , on aurait ici :

 $\(\mathbb{E}(XY) = 0\)$

Covariance

Soit $\((X,Y)\)$ un couple de variables aléatoires discrètes. On appelle covariance de $\(X \)$ et $\(Y\)$  le réel noté $\(\mathbb{C}ov(X,Y) \)$ et défini, s'il existe, par :

  $\(\mathbb{C}ov(X,Y) = \mathbb{E}((X-\mathbb{E}(X))(Y-\mathbb{E}(Y)))\)$

Formule de Huygens

Si X et Y admettent une covariance, alors on a :

  $\(\mathbb{C}ov (X,Y) = \mathbb{E}(XY)-\mathbb{E}(X)\mathbb{E}(Y)\)$

En pratique, c'est cette formule que l'on utilisera dans les exercices.

Propriétés de la covariance

Symétrie

La covariance est symétrique : $\(\mathbb{C}ov(X,Y) = \mathbb{C}ov(Y,X) \)$

Covariance et variance

 $\(\mathbb{C}ov(X,X)\)$ = $\(\mathbb{V}(X)\)$

Bilinéarité

 $\(\mathbb{C}ov(aX_1 + bX_2,Y) = a\mathbb{C}ov(X_1,Y) + b\mathbb{C}ov(X_2,Y)\)$

 $\(\mathbb{C}ov(X, aY_1 + bY_2) = a\mathbb{C}ov(X,Y_1) + b\mathbb{C}ov(X,Y_2)\)$

Variance de la somme de deux VAD

Si X et Y sont deux VAD définies sur le même espace probabilisé et admettant des variances, alors d'une part, la covariance de X et Y existe et d'autre part, X + Y admet une variance, et on a :

  $\(\mathbb{V}(X + Y) = \mathbb{V}(X) + \mathbb{V}(Y) + 2\mathbb{C}ov(X,Y)\)$

Corrélation

Dans cette section, nous considérons X et Y comme deux variables aléatoires discrètes admettant des variances non nulles.

On appelle coefficient de corrélation linéaire de X et Y, le réel noté $\(\rho (X,Y)\)$ et défini par :

  $\(\rho (X,Y) = \frac{\mathbb{C}ov(X,Y)}{\sqrt{\mathbb{V}(X)}\sqrt{\mathbb{V}(Y)} }\)$

 Pour tout couple (X,Y) de variables aléatoires, on a $\( -1 \leq \rho(X,Y] \leq 1\)$ .

Cas de l'indépendance de deux variables aléatoires

Conséquence sur l'espérance

Si $\(X \)$ et $\(Y \)$ deux variables aléatoires indépendantes admettant chacune une espérance, alors la variable aléatoire $\(XY \)$ admet également une espérance et on a :

 $\(\mathbb{E}(XY) = \mathbb{E}(X)\mathbb{E}(Y)\)$

Conséquence sur la covariance

Si $\(X \)$ et $\(Y \)$ deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors   $\(\mathbb{C}ov(X,Y)=0\)$ .

Ce qui peut être interprété de la manière suivante : deux VAD indépendantes ne sont pas corrélées.

La non-corrélation est une condition nécessaire, mais pas suffisante à l'indépendance.

Conséquence sur la variance

Si $\(X \)$ et $\(Y \)$ deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors  $\(\mathbb{V}(X +Y)=\mathbb{V}(X) + \mathbb{V}(Y)\)$ .

Exemple de certificat de réussite
Exemple de certificat de réussite