Partage
  • Partager sur Facebook
  • Partager sur Twitter

Gestion de Dataframe

Pandas

    16 juin 2021 à 21:55:42

    Bonjour,

    Je cherche à créer un dataframe à partir d'un fichier .csv.  Voici mon code:

    import pandas as pd
    import numpy as np
    
    data=pd.read_csv('EURUSD.csv')
    
    
    
    data_df=pd.DataFrame(data, columns=['Date' , 'Heure' ,'Open' , 'High' , 'Low', 'Close' , 'Volume'])
    
    moyenne=np.zeros(len(data))
    
    print(data_df)

    Or lorsque je cherche à afficher le dataframe ainsi créé, il est uniquement remplit de valeurs manquantes NaN. Je n'arrive pas à comprendre qu'elle est l'origine du problème et je cherche donc de l'aide.

    Une de mes poste est que le fichier est un csv mais que les valeurs dans se fichier sont entrées dans des colonnes et ne sont donc pas séparées par des virgules (cf image ci-dessous).

    Merci de votre aide

    • Partager sur Facebook
    • Partager sur Twitter
      16 juin 2021 à 22:18:29

      Bonsoir,

      Il faut préciser le séparateur de ton fichier CSV, virgule ou des fois point-virgule.

      data=pd.read_csv('EURUSD.csv', sep=',')



      • Partager sur Facebook
      • Partager sur Twitter
        16 juin 2021 à 22:56:45

        Comme je l'ai expliqué ci-dessus, je n'ai pas de séparateur dans mon fichier csv car les données séparées en étant placées dans des colonnes (je ne comprends pas l'intérêt d'avoir un csv mais c'est le fichier avec lequel je dois travailler)
        • Partager sur Facebook
        • Partager sur Twitter
          16 juin 2021 à 23:47:10

          FlorianGirardi a écrit:

          Comme je l'ai expliqué ci-dessus, je n'ai pas de séparateur dans mon fichier csv car les données séparées en étant placées dans des colonnes (je ne comprends pas l'intérêt d'avoir un csv mais c'est le fichier avec lequel je dois travailler)


          Alors là !!! Un fichier CSV n'est qu'un vulgaire fichier texte utilisant un séparateur pour délimiter les données.

          Avec quoi tu affiches ce fameux fichier pour qu'il soit représenté ainsi ?

          • Partager sur Facebook
          • Partager sur Twitter
            17 juin 2021 à 8:26:25

            Je l'affiche avec excel et j'obtiens le rendu présenté dans le screen shot de mon premier post. Mais j'ai réussi à résoudre mon problème, cependant je suis maintenant confronté à une autre difficulté. 

             Lorsque je créé mon dataframe, la première ligne de données est automatiquement considérée comme le nom de mes colonnes. De ce fait, quand j'éssaie ensuite de changer le nom de mes colonnes à l'aide de la commande columns="...", j'arrive à changer le nom de mes colonnes mais je perds donc les informations de ma première ligne de données. Y'a-t-il un moyen d'y remédier?

            • Partager sur Facebook
            • Partager sur Twitter
              17 juin 2021 à 9:16:28

              C'est marqué dans la doc. header = None

              • Partager sur Facebook
              • Partager sur Twitter
                17 juin 2021 à 12:29:55

                merci

                Nephthys a écrit:

                C'est marqué dans la doc. header = None



                • Partager sur Facebook
                • Partager sur Twitter
                  17 juin 2021 à 19:03:33

                  ouvre ton csv avec le bloc notes pour voir quel est le séparateur, ainsi tu pourra le préciser aussi
                  • Partager sur Facebook
                  • Partager sur Twitter

                  Gestion de Dataframe

                  × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                  • Editeur
                  • Markdown