• 10 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 22/08/2022

Représenter vos variables

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Compétences évaluées

  • Représenter vos variables
  • Question 1

    La distribution empirique d'une variable correspond :

    • aux différentes modalités d'une variable qualitative

    • à la discrétisation d'une variable quantitative

    • à une représentation graphique adaptée aux variables qualitatives

    • au calcul des effectifs associés à chaque modalité d'une variable qualitative

  • Question 2

    Soit un jeu de données de vente nommé  data  , contenant plusieurs milliers de lignes et trois variables :

    • id : correspondant à l'identifiant client ;
    • cat : la catégorie de produit achetée ;
    • price : le prix du produit acheté par le client.

    Que représente le code suivant :

    data["cat"].value_counts(normalize=True).plot(kind='bar',width=0.1)
    plt.show()
    • Le montant total perçu par chaque catégorie

    • Un histogramme de la variable catégorie

    • La proportion de produits vendus par catégorie

    • Le nombre de produits vendus par catégorie

  • Question 3

    Observez le tableau suivant :

    Animal

    Nombre

    Fréquence

    Chien 49 0.35
    Chat 56 0.39
    Lapin 37 0.26

    Quelles affirmations sont vraies parmi les suivantes ?

    Attention, plusieurs réponses sont possibles.
    • La fréquence cumulée associée à la modalité Chat est 0.64

    • Si on avait ce tableau sous forme de dataframe nommé  data  , la ligne data["Fréquence"].sum()donnerait 1

    • La construction de ce tableau a nécessité une discrétisation

    • Une méthode   value_counts()  aurait pu nous permettre d'obtenir ce tableau