• 10 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 22/08/2022

Réaliser une analyse bivariée

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Compétences évaluées

  • Réaliser une analyse bivariée

Description

Pour ce quiz, tout comme lors de la partie 2, vous allez avoir à pratiquer un peu de Python pour pouvoir répondre aux questions. Le jeu de données sera d'ailleurs le même, à la différence près que celui-ci est nettoyé de ses nombreuses erreurs. Pour rappel : il concerne les résultats de 340 coureurs ayant réalisé un 10 km, relevés à l'arrivée. Vous trouverez le jeu de données ici. Il contient pour chaque individu :

  • la position à l'arrivée ;
  • son genre ;
  • le temps effectué en heures:minutes:secondes ;
  • son département de résidence ;
  • le temps effectué en secondes ;
  • son âge.
  • Question 1

    Lorsque l'on analyse la corrélation entre la position et l'âge des coureurs, on obtient un coefficient de Pearson de 0,106. Que signifie ce coefficient ?

    • Qu'il y a une corrélation importante entre nos deux variables

    • Qu'à partir de l'âge, on peut déterminer de façon précise la position d'arrivée de nos individus

    • Qu'il n'y a aucun lien de cause à effet entre l'âge et la position d'arrivée

    • Qu'il n'y a apparemment pas de corrélation entre nos deux variables

  • Question 2

    Réalisez à présent une discrétisation de la variable Age, vous pourrez par exemple séparer les individus par tranches de 10 ans. Qu'observez-vous à présent, si vous analysez la corrélation entre la discrétisation de la variable Age et la Position à l'arrivée ?

    • Il n'y a pas de corrélation apparente

    • On observe une corrélation importante

    • On observe une faible corrélation

    • Les analyses menées ne permettent pas de tirer de conclusion

  • Question 3

    Soit X la variable Age et Y la variable Position. Quels sont les coefficients   a et b obtenus par une régression linéaire qui chercherait à calculer :

    Y=a.X+b

    Et quel est la variance expliquée par le modèle ?

      • a=0.86
      • b=134.3
      • R2=0.106
      • a=134.3
      • b=0.86
      • R2=0.106

       

      • a=0.86
      • b=134.3
      • R2=0.011

       

      • a=134.3
      • b=0.86
      • R2=0.011