• 12 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 08/11/2024

Identifiez les tests quantitatifs pertinents

L’âge des voyageurs, le budget qu’ils dépensent annuellement dans leurs périples, le nombre de personnes avec qui ils ont voyagé…Nous avons vu que toutes ces informations-là sont des données quantitatives.

Et bien maintenant, nous allons nous focaliser sur les méthodes qui existent pour tester ces fameuses données. Ça tombe bien car June nous a demandé d’analyser la relation entre la durée des séjours et le prix total des voyages.

Ok, mais d’abord que cherche-t-on exactement à comprendre avec ce genre de tests ?

Identifiez les besoins

Explorez les relations entre les différentes variables quantitatives

Savoir si deux variables sont corrélées vous aide à comprendre comment elles s’influencent l'une et l'autre. Ces tests sont aussi appelés tests de corrélation.

Vérifiez si les résultats ne sont pas dus au hasard

Les tests de corrélation combinés au calcul de la valeur p vous permettent de déterminer si les relations observées entre les variables sont statistiquement significatives ou simplement dues à des variations aléatoires. Ça renforce la validité de vos conclusions et vous aide à éviter des décisions basées sur des relations accidentelles.

Prenez des décisions éclairées

Comprendre ces relations vous permet de prendre des décisions stratégiques basées sur des données.

Les tests de corrélation comme Pearson et Spearman sont spécifiquement conçus pour les données quantitatives car ils analysent les relations entre les variables.

Choisissez le test Pearson

Le test de corrélation de Pearson mesure la force et la direction de la relation linéaire entre deux variables quantitatives (dépenses publicitaires et nombre de réservations par exemple). Il est représenté par le coefficient de corrélation r, qui varie entre -1 et 1 :

  • r=1 : Corrélation positive parfaite.

  • r=−1  : Corrélation négative parfaite.

  • r=0 : Aucune corrélation.

L’hypothèse nulle est d’affirmer qu’il n’y a pas de corrélation linéaire entre les deux variables. L’hypothèse alternative est de dire qu’il y a bien une corrélation linéaire entre les deux variables.

Les conditions d'application sont variées :

  • Les deux variables doivent être quantitatives.

  • Les paires de données (chaque point de donnée pour les deux variables) doivent être indépendantes.

  • Les données doivent suivre une distribution normale.

  • La relation observée entre les variables doit être linéaire. 

Autre exemple de corrélation que VertiGo

Suite à une analyse de données, vous concluez qu'il existe une relation linéaire positive forte entre la surface des appartements et leur prix. En pratique, cela signifie que les appartements plus grands tendent à être plus chers.

Choisissez le test Spearman

Le test de corrélation de Spearman mesure la force et la direction de la relation entre deux variables quantitatives (durée du séjour et prix total des voyages par exemple) ou ordinales. Il est représenté par le coefficient de corrélation ρ (rho), qui varie entre -1 et 1 :

  • ρ=1 : Corrélation positive parfaite.

  • ρ=−1 : Corrélation négative parfaite.

  • ρ=0 : Aucune corrélation.

Encore une fois, l’hypothèse nulle est d’affirmer qu’il n’y a pas de corrélation linéaire entre les deux variables. L’hypothèse alternative est de dire qu’il y a bien une corrélation linéaire entre les deux variables.

Les conditions d'application sont variées :

  • Les deux variables doivent être quantitatives

  • Les paires de données doivent être indépendantes.

  • Les données n’ont pas besoin de suivre une distribution normale. 

  • La relation entre les variables n'a pas besoin d'être linéaire mais elle peut être monotone. 

Autre exemple de corrélation que VertiGo

Une entreprise de commerce en ligne souhaite savoir si le nombre de visites sur son site web est corrélé avec les revenus générés. Les données ne suivent pas une distribution normale et la relation est monotone mais non linéaire, le test de Spearman est donc approprié.

Vérifiez toujours la valeur p associée à vos tests

Comme nous l’avons vu pour les tests de normalité, la valeur p est aussi déterminante ici. Si votre corrélation est parfaite et si sa valeur p associée est inférieure au seuil de 0,05, votre test est valable et vous pouvez continuer sur cette voie ! En d'autres termes, il y a suffisamment de preuves pour rejeter l'hypothèse nulle selon laquelle il n'y a pas de corrélation dans la population d'où les échantillons sont tirés.

Mais si p est supérieur à 0,05, alors cette corrélation pourrait être due au hasard et non à une relation réelle entre les variables.

Cartographiez votre test

Cet arbre de décision récapitule la marche à suivre quand vous serez confronté à deux variables quantitatives.

Un organigramme pour la sélection d'un test quantitatif entre deux variables quantitatives. Il présente deux options principales : Test paramétrique avec le Test de Pearson et Test non paramétrique avec le Test de Spearman.
Arbre de décision pour tester la corrélation de variables

À vous de jouer

Contexte

Il est encore trop tôt pour réaliser les tests statistiques. Mais vous avez reçu les informations nécessaires pour sélectionner le test le plus adapté aux données.

À partir de “Données entreprise VertiGo nettoyées”, vous devez comparer les revenus de vente en fonction du nombre de clients. Après avoir examiné les données, vous avez observé que les données semblent suivre une distribution normale et qu'il existe une relation linéaire entre ces deux variables.

Consignes

  1. Déterminez quel test de corrélation entre Pearson ou Spearman est le plus adapté.

  2. Justifiez votre choix en expliquant pourquoi ce test est le plus approprié compte tenu des conditions et des caractéristiques des données.

Livrable

Rédigez un rapport justifiant votre choix.

En résumé

  • Les tests de corrélation, comme ceux de Pearson et Spearman, permettent d’analyser la relation entre deux variables quantitatives pour comprendre comment elles s’influencent mutuellement.

  • Le test de Pearson mesure la force et la direction de la relation linéaire entre deux variables quantitatives, avec un coefficient de corrélation r variant entre -1 et 1, et nécessite des données normalement distribuées et une relation linéaire.

  • Le test de Spearman mesure la force et la direction de la relation entre deux variables, qu’elles soient quantitatives ou ordinales, sans nécessiter une distribution normale, avec une relation monotone mais non nécessairement linéaire.

  • Une valeur p inférieure à 0,05 indique une corrélation réelle, tandis qu'une valeur supérieure suggère une corrélation due au hasard.

Vous connaissez les deux principaux tests pour identifier les potentielles corrélations entre variables, il est maintenant temps de vérifier l'indépendance entre les variables qualitatives. 

Exemple de certificat de réussite
Exemple de certificat de réussite