Partage
  • Partager sur Facebook
  • Partager sur Twitter

data et python

cas d'usage de python dans un métier de data analyst

    24 janvier 2024 à 23:41:44

    Bonjour à tous,

    Dans le cadre de ma reconversion davantage orientée sur la data, je suis en train d'apprendre python et maintenant la bibliothèque Pandas.

    Au fil de mon apprentissage, j'essaie de comprendre dans quel contexte, un data analyst par exemple, va utiliser des requetes Python Pandas. 

    Par exemple, prenons l'exemple de ce code justement issu d'un de mes exercices (sortir les 3 entreprises ayant les plus gros profits):

    import pandas as pd
    import numpy as np
    
    result = forbes_global.groupby('company')['profits'].sum(
    ).reset_index().sort_values(by='profits', ascending=False)
    result['rank'] = result['profits'].rank(method='min', ascending=False)
    result = result[result['rank'] <= 3][['company', 'profits']]

    Au même titre qu'une requete SQL qui va afficher une information spécifique, Python Pandas fait la même chose ... 

    L'idée n'est-elle pas justement d'incorporer l'ensemble des données dans un outil BI type Tableau pour faire sortir cette information spécifiquement au lieu de la coder en python ?

    Peut-être que ma question est stupide, mais j'ai besoin d'avoir du contexte pour bien apprendre parce que ça revient à apprendre un langage sans y voir l'utilité et les cas d'usage derrière c'est dommage et décourageant 

    Merci pour votre aide :)

    -
    Edité par Boubz 24 janvier 2024 à 23:43:43

    • Partager sur Facebook
    • Partager sur Twitter
      25 janvier 2024 à 8:31:44

      j'essaie de comprendre dans quel contexte, un data analyst par exemple, va utiliser des requetes Python Pandas.

      La réponse est dans le terme "data analyst", un métier où le développeur analyse et traite des données

      L'idée n'est-elle pas justement d'incorporer l'ensemble des données dans un outil BI type Tableau pour faire sortir cette information spécifiquement au lieu de la coder en python ?

      pandas crée et traite déjà des tableaux (dataframe). Il n'y a pas besoin d'outil BI. Tu confonds fond et forme, le fond du traitement est fait avec pandas, la forme est au choix, HTML, PDF, JPEG, ... mais pandas sait dessiner, par ex. des camemberts et divers autres graphiques.

      Tu as une page dédiée à la comparaison avec divers outils, la doc est bien fournie, tu auras toutes tes réponses.

      • Partager sur Facebook
      • Partager sur Twitter

      Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
      La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)

        25 janvier 2024 à 11:57:04

        Analyser un tas de données pour en sortir les entreprises qui ont fait le plus de profits est le contexte supposé donner du sens à un exercice. Le seul but est de vous motiver à pratiquer/découvrir pandas et non des recettes de cuisine où on dirait dans tel cas, appliquer telle solution.

        On pourrait faire la même chose sans pandas (avec les fonctionnalités de base de Python), avec EXCEL, ou même un BI,...

        • Partager sur Facebook
        • Partager sur Twitter
          25 janvier 2024 à 14:37:21

          Merci pour vos réponse.

          J'aimerais juste comprendre les cas d'usage pour lesquels un data analyst utilisera du code python Pandas hormis pour faire de la data viz avec metalib par exemple.

          Autant SQL j'ai compris qu'il va permettre de récupérer un ensemble de données pertinentes dans le cadre d'une analyse data viz, au lieu de récupérer l'ensemble des données du DWH, SQL va lui permettre de segmenter logiquement la données pour l'analyser sur un outil BI.

          • Partager sur Facebook
          • Partager sur Twitter

          data et python

          × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
          • Editeur
          • Markdown