Chez VertiGo, vous le savez, on traite avec des données quantitatives et qualitatives. La base de données sur laquelle nous travaillons depuis le début en est la preuve !
Dans ce contexte-ci, June vous a demandé de comparer la satisfaction client et la saison et la satisfaction client avec le type de voyage.
Ok, mais pourquoi analyser ces données séparément n’est pas suffisant ? Que cherche-t-on exactement à comprendre avec ce genre de tests ?
Cette approche mixte est très intéressante car elle permet d'exploiter le meilleur des deux mondes : la précision et la rigueur des données quantitatives et la richesse et la profondeur des données qualitatives. Pour VertiGo, cette approche peut offrir des insights plus actionnables et stratégiquement pertinents, conduisant à une meilleure satisfaction client et à une optimisation des offres et des services.
Identifiez les besoins
Explorez les relations entre les différentes variables mixtes
Comprendre comment des variables quantitatives et qualitatives interagissent va vous aider à obtenir une vision plus complète de vos données.
Vérifiez si les résultats ne sont pas dus au hasard
En utilisant des tests statistiques appropriés, vous pouvez déterminer si les relations observées entre les variables sont significatives ou si elles sont simplement dues à des variations aléatoires. Cela renforce la validité de vos conclusions et évite des décisions basées sur des coïncidences.
Prenez des décisions éclairées
Des analyses robustes vous permettent de prendre des décisions stratégiques informées par des données, que ce soit pour améliorer l'expérience client ou optimiser les coûts.
Les tests T et ANOVA (Analysis of variance) sont les principaux tests utilisés pour analyser des données mixtes.
Choisissez le test T
Le test T est utilisé pour comparer les moyennes de deux groupes et voir s'il y a une différence statistiquement significative entre eux. Par exemple, VertiGo pourrait vouloir savoir si la satisfaction moyenne des clients diffère entre ceux qui ont voyagé en été et ceux qui ont voyagé en hiver. L’hypothèse nulle est d’affirmer qu’il n’y a pas de différence entre les deux moyennes des deux groupes. L’hypothèse alternative est de dire qu’il y en a bien une.
Les conditions d'application sont variées :
Les données doivent être indépendantes.
Il ne peut y avoir uniquement que deux groupes à comparer.
Les deux groupes doivent suivre une distribution normale.
Les variances des deux groupes doivent être égales.
Pour ce test, vous avez besoin de connaître ce qu’est la statistique de test T. Cette dernière mesure la différence relative entre les moyennes des deux groupes par rapport à la variation observée dans les données.
Autre exemple que VertiGo
L’objectif d’une étude pourrait être d’évaluer l’efficacité d’un nouveau médicament sur la pression artérielle. Pour cela, deux groupes de patients seraient comparés : groupe de traitement (ceux qui reçoivent le médicament) et groupe de contrôle (ceux qui reçoivent un placebo). La réduction de la pression artérielle est une variable quantitative mesurable alors que le groupe auquel chaque patient appartient est une variable qualitative. Le test T serait alors utilisé pour comparer la moyenne des réductions de la pression artérielle entre les deux groupes.
Choisissez ANOVA
Le test ANOVA permet d’analyser des variances ou de comparer les moyennes de trois groupes ou plus pour voir s'il y a une différence statistiquement significative entre elles. Par exemple, VertiGo pourrait analyser la satisfaction des clients selon les types de voyage (aventure, détente, culturel).
Comme pour le test T, l’hypothèse nulle est d’affirmer qu’il n’y a pas de différence entre les deux moyennes des groupes. L’hypothèse alternative est de dire qu’il y en a bien une.
Les conditions d'application sont variées :
Les données doivent être indépendantes.
Les groupes comparés doivent être au nombre de trois ou plus.
Les groupes doivent suivre une distribution normale.
Les variances des groupes doivent être égales.
Pour ce test, vous avez besoin de connaître ce qu’est la statistique de test F. C’est elle qui mesure la variabilité entre les groupes par rapport à la variabilité au sein des groupes.
Autre exemple que VertiGo
L’objectif d’une étude pourrait être de mesurer la consommation énergétique des maisons en fonction du type d'isolation utilisé et de déterminer s'il existe un écart significatif entre les différents types d'isolation. Pour cela, trois types d'isolation seraient comparés : laine de verre, polystyrène et fibre de bois. La consommation énergétique (en kWh) est une variable quantitative mesurable alors que les trois types d’isolant sont des variables qualitatives. Le test ANOVA serait alors utilisé pour comparer les moyennes de plusieurs groupes simultanément et pour déterminer si au moins un groupe diffère significativement des autres. Dans le contexte de l'isolation des maisons, cette analyse aide à identifier quel type d'isolation est le plus efficace en termes de consommation énergétique.
Vérifiez toujours la valeur p associée à vos tests
Encore une fois (je ne le répéterai jamais assez !) mais n’oubliez pas de calculer, la valeur p. Si la valeur p est inférieure à 0.05, on rejette l'hypothèse nulle, indiquant une différence significative entre les groupes.
Cartographiez votre test
Cet arbre de décision récapitule la marche à suivre quand vous serez confronté à des variables quantitatives et qualitatives.
À vous de jouer
Contexte
Il y a encore une dernière étape avant de passer à la réalisation des tests !
À partir de “Données clients VertiGo nettoyées”, vous devez examiner si l'âge moyen des clients varie selon le type de voyage (aventure, détente, culturel).
Consignes
Déterminez quel test entre T ou ANOVA est le plus adapté.
Justifiez votre choix en expliquant pourquoi ce test est le plus approprié compte tenu des conditions et des caractéristiques des données.
Livrable
Rédigez un rapport justifiant votre choix.
En résumé
Analyser l'interaction entre variables quantitatives et qualitatives permet d'obtenir une vision plus complète des données.
Le test T est utilisé pour comparer les moyennes de deux groupes, avec des données indépendantes, des distributions normales et des variances égales.
Le test ANOVA est utilisé pour comparer les moyennes de trois groupes ou plus, avec des données indépendantes, des distributions normales et des variances égales.
Une valeur p inférieure à 0.05 indique une différence significative entre les groupes, permettant de rejeter l'hypothèse nulle.
Vous avez toutes les clés en main pour sélectionner le test qui correspond à vos attentes. Voyons maintenant comment exécuter ces tests et comment interpréter leurs résultats.