• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 19/05/2023

Découvrez les notions de covariance et de corrélation linéaire

Faites vous accompagner pour apprendre le métier de data architect avec la formation architecture big data.

Covariance de deux variables aléatoires discrètes

Espérance du produit de deux VAD

Soit $\( (X, Y)\)$ un couple de variables aléatoires discrètes. Si la variable aléatoire $\(XY \)$ possède une espérance, alors cette dernière est définie par :

$\(\mathbb{E}(XY) = \sum_{x_i \in X(\Omega) y_j \in Y(\Omega)}{x_i y_i \mathbb{P}([X = x_i] \cap [Y = y_j])}\)$

Exemple

On reprend l'exemple du lancer de dé à 6 faces des chapitres précédents. Soit X la VAD qui vaut 1 si on obtient 6, et 0 sinon, et Y la VAD qui vaut 1 si on obtient 5, et 0 sinon.

Ces deux VAD sont de même loi. Elles suivent la loi de Bernoulli de paramètre $\(\frac{1}{6}\)$ .

Ici, comme la probabilité que les deux variables prennent la valeur 1 en même temps, autrement dit $\(\mathbb{P}([X=1]\)$$\(\cap [Y=1])\)$ , est nulle, en appliquant la définition ci-dessus pour le calcul de l'espérance de $\(XY\)$ , on aurait ici :

 $\(\mathbb{E}(XY) = 0\)$

Covariance

Soit $\((X,Y)\)$ un couple de variables aléatoires discrètes. On appelle covariance de $\(X \)$ et $\(Y\)$  le réel noté $\(\mathbb{C}ov(X,Y) \)$ et défini, s'il existe, par :

  $\(\mathbb{C}ov(X,Y) = \mathbb{E}((X-\mathbb{E}(X))(Y-\mathbb{E}(Y)))\)$

Formule de Huygens

Si X et Y admettent une covariance, alors on a :

  $\(\mathbb{C}ov (X,Y) = \mathbb{E}(XY)-\mathbb{E}(X)\mathbb{E}(Y)\)$

En pratique, c'est cette formule que l'on utilisera dans les exercices.

Propriétés de la covariance

Symétrie

La covariance est symétrique : $\(\mathbb{C}ov(X,Y) = \mathbb{C}ov(Y,X) \)$

Covariance et variance

 $\(\mathbb{C}ov(X,X)\)$ = $\(\mathbb{V}(X)\)$

Bilinéarité

 $\(\mathbb{C}ov(aX_1 + bX_2,Y) = a\mathbb{C}ov(X_1,Y) + b\mathbb{C}ov(X_2,Y)\)$

 $\(\mathbb{C}ov(X, aY_1 + bY_2) = a\mathbb{C}ov(X,Y_1) + b\mathbb{C}ov(X,Y_2)\)$

Variance de la somme de deux VAD

Si X et Y sont deux VAD définies sur le même espace probabilisé et admettant des variances, alors d'une part, la covariance de X et Y existe et d'autre part, X + Y admet une variance, et on a :

  $\(\mathbb{V}(X + Y) = \mathbb{V}(X) + \mathbb{V}(Y) + 2\mathbb{C}ov(X,Y)\)$

Corrélation

Dans cette section, nous considérons X et Y comme deux variables aléatoires discrètes admettant des variances non nulles.

On appelle coefficient de corrélation linéaire de X et Y, le réel noté $\(\rho (X,Y)\)$ et défini par :

  $\(\rho (X,Y) = \frac{\mathbb{C}ov(X,Y)}{\sqrt{\mathbb{V}(X)}\sqrt{\mathbb{V}(Y)} }\)$

 Pour tout couple (X,Y) de variables aléatoires, on a $\( -1 \leq \rho(X,Y] \leq 1\)$ .

Cas de l'indépendance de deux variables aléatoires

Conséquence sur l'espérance

Si $\(X \)$ et $\(Y \)$ deux variables aléatoires indépendantes admettant chacune une espérance, alors la variable aléatoire $\(XY \)$ admet également une espérance et on a :

 $\(\mathbb{E}(XY) = \mathbb{E}(X)\mathbb{E}(Y)\)$

Conséquence sur la covariance

Si $\(X \)$ et $\(Y \)$ deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors   $\(\mathbb{C}ov(X,Y)=0\)$ .

Ce qui peut être interprété de la manière suivante : deux VAD indépendantes ne sont pas corrélées.

La non-corrélation est une condition nécessaire, mais pas suffisante à l'indépendance.

Conséquence sur la variance

Si $\(X \)$ et $\(Y \)$ deux variables aléatoires discrètes indépendantes, et admettant chacune une variance, alors  $\(\mathbb{V}(X +Y)=\mathbb{V}(X) + \mathbb{V}(Y)\)$ .

Exemple de certificat de réussite
Exemple de certificat de réussite