Partage

[COURS] Nettoyez et décrivez votre jeu de données

11 septembre 2018 à 19:30:53

Bonjour LamineGueye10.

En général, l'erreur est expliquée tout en bas du message d'erreur. N'hésitez pas à y jeter un oeil.

Ici, il est écrit "

FileNotFoundError: File b'operations.csv' does not exist

Je vous laisse chercher un peu la cause, et si vous ne trouvez pas nous pourrons vous aider un peu plus

LamineGueye10 a écrit:

j'ai des problèmes pour importer le fichier opération

IL affiche cela

FileNotFoundError                         Traceback (most recent call last)
<ipython-input-5-4b82e6fca4ec> in <module>()
 1 import pandas as pd
----> 2data = pd.read_csv("operations.csv",parse_dates=[1,2])
 3 print(data)

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
 676                     skip_blank_lines=skip_blank_lines)
 677 
--> 678return _read(filepath_or_buffer, kwds)
 679 
 680     parser_f.__name__ = name

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _read(filepath_or_buffer, kwds)
 438 
 439     # Create the parser.
--> 440parser = TextFileReader(filepath_or_buffer, **kwds)
 441 
 442     if chunksize or iterator:

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, f, engine, **kwds)
 785             self.options['has_index_names'] = kwds['has_index_names']
 786 
--> 787self._make_engine(self.engine)
 788 
 789     def close(self):

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _make_engine(self, engine)
 1012     def _make_engine(self, engine='c'):
 1013         if engine == 'c':
-> 1014self._engine = CParserWrapper(self.f, **self.options)
 1015         else:
 1016             if engine == 'python':

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, src, **kwds)
 1706         kwds['usecols'] = self.usecols
 1707 
-> 1708self._reader = parsers.TextReader(src, **kwds)
 1709 
 1710         passed_names = self.names is None

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader.__cinit__()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._setup_parser_source()

FileNotFoundError: File b'operations.csv' does not exist

LamineGueye10

12 septembre 2018 à 23:23:55

j'ai trouvé l'erreur. Merci

KhadijaIraoui1

14 septembre 2018 à 10:34:11

Bonjour ;

j'ai eu ce message d'erreur :

---------------------------------------------------------------------------NameError Traceback (most recent call last) <ipython-input-1-ff51cfa4a764> in <module>() 1# Controle des colonnes 2for c in['date_operation','libelle','debit','credit']:----> 3if c notin data.columns: 4if(c in['debit','credit']and'montant'notin data.columns)or(c notin['debit','credit']): 5 msg ="Il vous manque la colonne '{}'. Attention aux majuscules "NameError: name 'data' is not defined

Merci bien pour votre retour??????????

Nicolas Rangeon

14 septembre 2018 à 11:37:54

KhadijaIraoui1 a écrit:

Bonjour ;

j'ai eu ce message d'erreur :

---------------------------------------------------------------------------NameError Traceback (most recent call last) <ipython-input-1-ff51cfa4a764> in <module>() 1# Controle des colonnes 2for c in['date_operation','libelle','debit','credit']:----> 3if c notin data.columns: 4if(c in['debit','credit']and'montant'notin data.columns)or(c notin['debit','credit']): 5 msg ="Il vous manque la colonne '{}'. Attention aux majuscules "NameError: name 'data' is not defined

Merci bien pour votre retour??????????

Bonjour,

Il semble que votre variable "data" soit inexistante. êtes-vous sûr d'avoir bien chargé le csv dans la variable data ? pouvez-vous insérer "print(data)" juste avant la ligne "for c in['date_operation','libelle','debit','credit']:" ?

AurélieGiraud1

24 septembre 2018 à 7:29:59

Bonjour Nicolas,

J'ai un souci avec le dernier code (Q4) du TP... il ne marche pas...Y'a un truc qui bug à partir de la fonction loc. J'essaie depuis hier de trouver d'où ça peut venir, mais je sèche un peu là...

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-22-d5b8a10a63d5> in <module>()
----> 1iris.loc[i,"petal_width"] = Y # on remplace la valeur manquante par Y
 2 lignes_modifiees.append(i)
 3 print("On a complété petal_width par {} a partir de petal_length={}".format(Y,X))

~\Anaconda3\lib\site-packages\pandas\core\indexing.py in __setitem__(self, key, value)
 187             key = com._apply_if_callable(key, self.obj)
 188         indexer = self._get_setitem_indexer(key)
--> 189self._setitem_with_indexer(indexer, value)
 190 
 191     def _validate_key(self, key, axis):

~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _setitem_with_indexer(self, indexer, value)
 467 
 468             if isinstance(value, ABCSeries):
--> 469value = self._align_series(indexer, value)
 470 
 471             info_idx = indexer[info_axis]

~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _align_series(self, indexer, ser, multiindex_indexer)
 775             return ser.reindex(ax)._values
 776 
--> 777raise ValueError('Incompatible indexer with Series')
 778 
 779     def _align_frame(self, indexer, df):

ValueError: Incompatible indexer with Series

Aurelie GIRAUD
Data Analyst Student

Yann5335

8 octobre 2018 à 7:21:43

Bonjour,

J'ai également du mal à importer lire les données avec Jupyter : quand j'essaie avec le fichier csv test, ça fonctionne

Quand j'essaie avec mon propre fichier (exporté depuis mon espace en ligne Boursorama), voilà le type d'erreur :

------------------

UnicodeDecodeError                        Traceback (most recent call last)
pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas\_libs\parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe8 in position 26: invalid continuation byte

During handling of the above exception, another exception occurred:

UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-30-7d3df61892ec> in <module>()
 1 import pandas as pd
----> 2data = pd.read_csv("operations2.csv",parse_dates=[0,1],sep= ';',decimal= ',', dayfirst=True, error_bad_lines=False)
 3 print(data)

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
 676                     skip_blank_lines=skip_blank_lines)
 677 
--> 678return _read(filepath_or_buffer, kwds)
 679 
 680     parser_f.__name__ = name

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _read(filepath_or_buffer, kwds)
 444 
 445     try:
--> 446data = parser.read(nrows)
 447     finally:
 448         parser.close()

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in read(self, nrows)
 1034                 raise ValueError('skipfooter not supported for iteration')
 1035 
-> 1036ret = self._engine.read(nrows)
 1037 
 1038         # May alter columns / col_dict

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in read(self, nrows)
 1846     def read(self, nrows=None):
 1847         try:
-> 1848data = self._reader.read(nrows)
 1849         except StopIteration:
 1850             if self._first_chunk:

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader.read()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._read_low_memory()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._read_rows()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_column_data()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas\_libs\parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe8 in position 26: invalid continuation byte

Quelqu'un saurait m'aider ?

Cordialement,

Yann

Pezman

25 octobre 2018 à 20:55:44

Pour l'erreur "

UnicodeDecodeError: 'utf-8'

J'avais la même...

Ouvrez votre fichier avec un editeur qui gere l'encodage (genre sublimetext), et enregistrez votre fichier avec l'encodage utf-8 (File --> Save with encoding)

-
Edité par Pezman 26 octobre 2018 à 11:59:54

AngeKoi2

30 octobre 2018 à 20:48:41

Porblème résolu après des recherches...

bonjour après avoir réussi l'importation de mon fichier perso j'ai saisie les lignes suivantes:

from collections import Counter

def most_common_words(labels):
    words = []
    for lab in labels:
        words += lab.split(" ")
    counter = Counter(words)
    for word in counter.most_common(100):
        print(word)
most_common_words(data['libelle'].values)

et j'ai le message suivant:

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-12-3c1cd7679545> in <module>()
      8     for word in counter.most_common(100):
      9         print(word)
---> 10 most_common_words(data['libelle'].values)

<ipython-input-12-3c1cd7679545> in most_common_words(labels)
      4     words = []
      5     for lab in labels:
----> 6         words += lab.split(" ")
      7     counter = Counter(words)
      8     for word in counter.most_common(100):

AttributeError: 'float' object has no attribute 'split'

j'aurais besoin d'aide pour resoudre cette erreur.

merci d'avance.

-
Edité par AngeKoi2 31 octobre 2018 à 18:59:51

AlexandraGardel

26 novembre 2018 à 11:14:09

Bonjour,

Ensuivant les instructions du cours de Nicolas, la constitution du fichier operations.enrichies.csv est arrivée au bout avec succès ! cependant j'ai ce message :

C:\Users\Garde\Anaconda3\ANACONDA bis\lib\site-packages\ipykernel_launcher.py:62: FutureWarning: `weekday_name` is deprecated and will be removed in a future version. Use `day_name` instead

Faut-il que je le prenne en compte et comment ?

Merci par avance,

(Nicolas, j'adore vos cours ! merci beaucoup)

Alexandra

AlexandraGardel

3 décembre 2018 à 11:35:54

Bonjour Aurélie, je suis également bloquée sur cette question Q4 du TP...

As tu reçue une réponse ou une piste qui t'a débloquée ?

Merci !

Alexandra

AurélieGiraud1 a écrit:

Bonjour Nicolas,

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-22-d5b8a10a63d5> in <module>()
----> 1iris.loc[i,"petal_width"] = Y # on remplace la valeur manquante par Y
 2 lignes_modifiees.append(i)
 3 print("On a complété petal_width par {} a partir de petal_length={}".format(Y,X))

~\Anaconda3\lib\site-packages\pandas\core\indexing.py in __setitem__(self, key, value)
 187             key = com._apply_if_callable(key, self.obj)
 188         indexer = self._get_setitem_indexer(key)
--> 189self._setitem_with_indexer(indexer, value)
 190 
 191     def _validate_key(self, key, axis):

~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _setitem_with_indexer(self, indexer, value)
 467 
 468             if isinstance(value, ABCSeries):
--> 469value = self._align_series(indexer, value)
 470 
 471             info_idx = indexer[info_axis]

~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _align_series(self, indexer, ser, multiindex_indexer)
 775             return ser.reindex(ax)._values
 776 
--> 777raise ValueError('Incompatible indexer with Series')
 778 
 779     def _align_frame(self, indexer, df):

ValueError: Incompatible indexer with Series

AnaisRossetto

10 décembre 2018 à 11:00:37

Bonjour, je souhaite suivre ce cours en utilisant R et je voulais savoir s'il existait le pas à pas en R (comme celui proposé dans le cours pour Python). Qui serait plus facile à reproduire que d'ouvrir un fichier de type preprocessing.

d avance merci

anais

Nicolas Rangeon

10 décembre 2018 à 11:54:02

Bonjour Aurélie,

Pouvez-vous me faire une capture d'écran du contenu de la variable iris et de la variable Y dans l'état dans lequel elles sont à cette ligne :

iris.loc[i,"petal_width"] = Y

Merci.

AurélieGiraud1 a écrit:

Bonjour Nicolas,

J'ai un souci avec le dernier code (Q4) du TP... il ne marche pas...Y'a un truc qui bug à partir de la fonction loc. J'essaie depuis hier de trouver d'où ça peut venir, mais je sèche un peu là...

Bonjour Alexandra, pour le warning, ce n'est pas grave, anaconda nous informe juste que dans les nouvelles versions du code à venir, il faudra penser à modifier 'weekday_name' en 'day_name' car weekday_name va être supprimée dans les prochaines versions (on dit qu'elle sera dépréciée). Cependant, elle reste encore active pour votre version actuelle d'anaconda.

AlexandraGardel a écrit:

Bonjour,

Ensuivant les instructions du cours de Nicolas, la constitution du fichier operations.enrichies.csv est arrivée au bout avec succès ! cependant j'ai ce message :

C:\Users\Garde\Anaconda3\ANACONDA bis\lib\site-packages\ipykernel_launcher.py:62: FutureWarning: `weekday_name` is deprecated and will be removed in a future version. Use `day_name` instead

Faut-il que je le prenne en compte et comment ?

Merci par avance,

(Nicolas, j'adore vos cours ! merci beaucoup)

Alexandra

Bonjour Anaïs, malheureusement il n'y a pas de version R pas-à-pas. Cepandant, les codes Python et R sont assez similaires et il devrait être assez simple de savoir quelle partie Python correspond à quelle partie en R. Utilisez-vous un notebook ou Rstudio pour exécuter les lignes de codes les unes après les autres pas-à-pas ?

AnaisRossetto a écrit:

Bonjour, je souhaite suivre ce cours en utilisant R et je voulais savoir s'il existait le pas à pas en R (comme celui proposé dans le cours pour Python). Qui serait plus facile à reproduire que d'ouvrir un fichier de type preprocessing.

d avance merci

anais

AnaisRossetto

10 décembre 2018 à 15:15:14

Merci Nicolas pour cette rapide réponse.

J'ai ouvert les doc sur un bloc note. Je ne trouve pas qu'il soit facile de faire la transposition python sur R, sauf si on a déjà un bon niveau.

Personnellement j'ai essayé et je trouve cela trop difficile. (je suis plutôt débutant en R, je suis en parallèle un cours pour apprendre à l'utiliser mais je reste débutante.

je vais donc passer ce cours seulement du point de vue de la théorie mais c est dommage car les applications sont très utiles à la compréhension.Peut être une prochaine version en pas à pas ...

credo

8 janvier 2019 à 23:58:58

Salut,

Je n'arrive pas à démarrer le notebook jupyter dans mon navigateur sur Win 10, ça se charge depuis des minutes sans rien afficher. Que faire , alors que mon installation sur Win 10 s'est bien passé( anaconda navigator démarre bien)?

ThomasLemoine2

17 janvier 2019 à 17:26:53

Bonjour,

J'ai deux petites questions sur la régression linéaire au niveau du code :

Pourquoi il y a-t-il une double [["..."']] pour la variable X.

A quoi correspond la ligne 4 ? J'ai bien essayé de l'enlever est on obtient le coefficient uniquement pour la variable "attente" avec un coeff différent.

merci d'avance !

KOUMARE SIRIKI

18 janvier 2019 à 4:34:15

Bonjour,

j'ai des problèmes pour importer le fichier operations.csv

IL affiche cela

FileNotFoundError                         Traceback (most recent call last)
<ipython-input-5-4b82e6fca4ec> in <module>()
 1 import pandas as pd
----> 2data = pd.read_csv("operations.csv",parse_dates=[1,2])
 3 print(data)

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
 676                     skip_blank_lines=skip_blank_lines)
 677 
--> 678return _read(filepath_or_buffer, kwds)
 679 
 680     parser_f.__name__ = name

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _read(filepath_or_buffer, kwds)
 438 
 439     # Create the parser.
--> 440parser = TextFileReader(filepath_or_buffer, **kwds)
 441 
 442     if chunksize or iterator:

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, f, engine, **kwds)
 785             self.options['has_index_names'] = kwds['has_index_names']
 786 
--> 787self._make_engine(self.engine)
 788 
 789     def close(self):

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _make_engine(self, engine)
 1012     def _make_engine(self, engine='c'):
 1013         if engine == 'c':
-> 1014self._engine = CParserWrapper(self.f, **self.options)
 1015         else:
 1016             if engine == 'python':

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, src, **kwds)
 1706         kwds['usecols'] = self.usecols
 1707 
-> 1708self._reader = parsers.TextReader(src, **kwds)
 1709 
 1710         passed_names = self.names is None

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader.__cinit__()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._setup_parser_source()

FileNotFoundError: File b'operations.csv' does not exist

Je vois qu'on me signale que mon fichier "operations.csv" n'existe pas

Et pourtant le fichier "operations.csv" et mon script se trouve dans le meme repertoire.

Merci de bien de bien vouloir m'aider.

-
Edité par KOUMARE SIRIKI 18 janvier 2019 à 4:39:48

norit

31 janvier 2019 à 15:13:02

Bonjour,

J'ai un problème de parse sur les dates. Ca fonctionne si j'enlève parse_dates=[1,2,5]

J'ai 3 dates : date de comptabilisation-date operation-date valeur

voilà la commande

data = pd.read_csv("operations.csv",
                   sep= ';', decimal= ',',
                   parse_dates=[1,2,5], dayfirst=True)

voila l'erreur

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-21-e594b5c19cb9> in <module>()
 1 data = pd.read_csv("operations1.csv",
 2                    sep= ';', decimal= ',',
----> 3 parse_dates=[1,2,5], dayfirst=True) 
C:\products\Anaconda3\lib\site-packages\pandas\io\parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
 676                     skip_blank_lines=skip_blank_lines)
 677 
--> 678return _read(filepath_or_buffer, kwds)
 679 
 680     parser_f.__name__ = name

C:\products\Anaconda3\lib\site-packages\pandas\io\parsers.py in _read(filepath_or_buffer, kwds)
 444 
 445     try:
--> 446data = parser.read(nrows)
 447     finally:
 448         parser.close()

C:\products\Anaconda3\lib\site-packages\pandas\io\parsers.py in read(self, nrows)
 1034                 raise ValueError('skipfooter not supported for iteration')
 1035 
-> 1036ret = self._engine.read(nrows)
 1037 
 1038         # May alter columns / col_dict

C:\products\Anaconda3\lib\site-packages\pandas\io\parsers.py in read(self, nrows)
 1887 
 1888                 values = self._maybe_parse_dates(values, i,
-> 1889 try_parse_dates=True)  1890                 arrays.append(values)
 1891 

C:\products\Anaconda3\lib\site-packages\pandas\io\parsers.py in _maybe_parse_dates(self, values, index, try_parse_dates)
 1946 
 1947     def _maybe_parse_dates(self, values, index, try_parse_dates=True):
-> 1948if try_parse_dates and self._should_parse_dates(index):
 1949             values = self._date_conv(values)
 1950         return values

C:\products\Anaconda3\lib\site-packages\pandas\io\parsers.py in _should_parse_dates(self, i)
 1319             else:
 1320                 name = None
-> 1321j = self.index_col[i]
 1322 
 1323             if is_scalar(self.parse_dates):

TypeError: 'NoneType' object is not subscriptable

Dernière remarque, mon CSV voit ses lignes finir avec ";". Est-ce que cela a un impacte ? Et comment l'enlever ?

-
Edité par norit 31 janvier 2019 à 15:13:54

Channing

5 février 2019 à 12:22:35

Bonjour,

Pour les sessions de "aller plus loin" de "La variance empirique corrigée" et "Calculs avec la variance empirique" du chapitre de "Comprenez les mesures de dispersion", j'ai du mal à comprendre des démonstrations de "variance empirique corrigée" et la relation de "vy = a2vx". Avez-vous d'autres démonstrations plus claires? En plus, je ne suis pas nulle en maths. Mais les démonstrations sont assez difficiles à interpreter. Vous remerciant par avance.

GlyoXine

28 février 2019 à 14:53:10

Bonjour,

A propos de la page https://openclassrooms.com/fr/courses/4525266-decrivez-et-nettoyez-votre-jeu-de-donnees/4775616-analysez-deux-variables-qualitatives-avec-le-chi-2

Pour le code "Voici le code affichant le tableau de contingence coloré", il manque l'import de seaborn pour exécuter le code sans erreur:

import seaborn as sns

tx = pd.DataFrame(tx)
ty = pd.DataFrame(ty)
tx.columns = ["foo"]
ty.columns = ["foo"]
n = len(data)
indep = tx.dot(ty.T) / n

c = c.fillna(0) # on remplace les valeurs nulles par des 0
mesure = (c-indep)**2/indep
xi_n = mesure.sum().sum()
sns.heatmap(mesure/xi_n,annot=c)
plt.show()

Rambert111

2 mars 2019 à 23:56:36

Bonjour

Je rencontre le même problème que Koumare Siriki : Je n'arrive pas à importer operations.csv sur mon Notebook Jupyter, qui existe bien et dans le même répertoire que mon script python

Merci d'avance

FileNotFoundError                         Traceback (most recent call last)
<ipython-input-14-36785e2f71ba> in <module>()
----> 1data = pd.read_csv("operations.csv")

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skipfooter, doublequote, delim_whitespace, low_memory, memory_map, float_precision)
    676                     skip_blank_lines=skip_blank_lines)
    677
--> 678return _read(filepath_or_buffer, kwds)
    679
    680     parser_f.__name__ = name

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _read(filepath_or_buffer, kwds)
    438
    439# Create the parser.
--> 440parser = TextFileReader(filepath_or_buffer,**kwds)
    441
    442if chunksize or iterator:

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, f, engine, **kwds)
    785             self.options['has_index_names']= kwds['has_index_names']
    786
--> 787self._make_engine(self.engine)
    788
    789def close(self):

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in _make_engine(self, engine)
   1012def _make_engine(self, engine='c'):
   1013if engine =='c':
-> 1014self._engine = CParserWrapper(self.f,**self.options)
   1015else:
   1016if engine =='python':

~\Anaconda3\lib\site-packages\pandas\io\parsers.py in __init__(self, src, **kwds)
   1706         kwds['usecols']= self.usecols
   1707
-> 1708self._reader = parsers.TextReader(src,**kwds)
   1709
   1710         passed_names = self.names isNone

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader.__cinit__()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._setup_parser_source()

FileNotFoundError: File b'operations.csv' does not exist

KOUMARE SIRIKI

5 mars 2019 à 13:45:21

Hello Simon, pour faire simple, crée un dossier sur ton bureau où tu vas mettre ton jeu de données, ensuite ouvre ton notebook et tu verras les differents dossiers sur ton ordinateur. Par ex si ton bureau s'appel Desktop, tu verras desktop, clique dessus et tu vas voir le dossier que tu as crée qui contient ton jeu de données. Enfin, regarde dans les onglets de droite, tu verras "New" clique dessus et choisir "Python 3". Tu seras maintenat pret pour coder, par defaut, le nom de ton fichier sera "untitled.ipynb" tu peux le renommer apres. Ton jeu de données et ton code seront maintenant dans le meme dossier. C'est tout. Merci

-
Edité par KOUMARE SIRIKI 5 mars 2019 à 13:50:15

Rambert111

7 mars 2019 à 5:56:06

Salut Koumare c'est moi qui te remercie. J'ai réussi à importer un autre dataset csv, cependant j'ai toujours le soucis avec operations.csv (séparateurs : points virgules); je pense que je devrais plutôt essayer de l'importer en txt

AlexandreBRIAND

5 avril 2019 à 16:21:57

Bonjour !

Juste une petite remarque, les réponses aux questions Q3 et Q4 de l'activité sont inversées dans la correction !

Bonne fin de journée

Mahfoud Bensari

23 avril 2019 à 15:48:05

Bonjour

J'ai eu le même problème, al hamdoulahh je l'ai résolue, fait un tour dans le répertoire "C:\Users\"

et essaye de trouver un répertoire genre ".anaconda".

si tu le trouve donc tu peut coller le fichiers "operations.csv" dans le même répertoire ou se trouve ".anaconda".

Bonne chance

YannickBoireaud

7 mai 2019 à 11:46:29

Bonjour,

Tout d'abord merci pour ce cours, je viens de le terminer et il est très clair. J'aimerais en faire un notebook plus personnel, mais pour cela j'aimerais savoir si les données sont disponible sur une plateforme type kaggle ou autre ? Cela permettra à mon notebook de directement télécharger les données, et qu'il soit autoportant !

Merci,

Bonne journée

chamsedineAidara1

7 mai 2019 à 18:32:00

Bonjour j'arrive pas à telecharger le fichier zip. j'obtiens l'erreur suivant:

AnissaMeguellati1

13 mai 2019 à 17:07:03

Bonjour,

Souci résolu

Merci :)

-
Edité par AnissaMeguellati1 13 mai 2019 à 17:09:17

chamsedineAidara1

20 mai 2019 à 16:12:26

chapitre : analyser deux variable quantitatives par régression linéaire

Bonjour ce code:

il faut convertir la colonne data_opetation en datetime au risque d'avoir une erreur.

la conversion est la suivante:

Nicolas Rangeon

23 mai 2019 à 19:05:42

Bonjour Thomas,

J'ai ajouté une précision dans le cours à ce sujet :

Une régression linéaire prédit une variable en fonction d'une ou plusieurs variables. sm.OLS s'attend donc à trouver une unique colonne (c-à-d un pd.Series ) en premier argument (ici Y), mais s'attend à trouver potentiellement plusieurs colonnes en 2nd argument (ici X, qui est un pd.DataFrame ). Pour sélectionner plusieurs colonnes d'un dataframe, on passe une liste de noms de colonnes. Et comme une liste s'écrit entre crochets, ceux-ci viennent s'ajouter aux crochers déjà présents !

ThomasLemoine2 a écrit:

Bonjour,

J'ai deux petites questions sur la régression linéaire au niveau du code :

Pourquoi il y a-t-il une double [["..."']] pour la variable X.

A quoi correspond la ligne 4 ? J'ai bien essayé de l'enlever est on obtient le coefficient uniquement pour la variable "attente" avec un coeff différent.

merci d'avance !

Richard G.

3 juin 2019 à 9:49:49

Bonjour,

Merci pour ce cours ainsi que pour votre disponibilité !

Au moment de corriger les activités des autres élèves pour ce cours, je me rends compte que les documents transmis n'ont rien à voir avec le sujet...

Et cela pour les 3 élèves que j'ai corrigé !

Est-ce un bug de la plateforme ?

Merci !

-
Edité par Richard G. 3 juin 2019 à 11:01:55

<< 1 2 3 4 >>