---------------------------------------------------------------------------NameError Traceback (most recent call last) <ipython-input-1-ff51cfa4a764> in <module>() 1# Controle des colonnes 2for c in['date_operation','libelle','debit','credit']:----> 3if c notin data.columns: 4if(c in['debit','credit']and'montant'notin data.columns)or(c notin['debit','credit']): 5 msg ="Il vous manque la colonne '{}'. Attention aux majuscules "NameError: name 'data' is not defined
---------------------------------------------------------------------------NameError Traceback (most recent call last) <ipython-input-1-ff51cfa4a764> in <module>() 1# Controle des colonnes 2for c in['date_operation','libelle','debit','credit']:----> 3if c notin data.columns: 4if(c in['debit','credit']and'montant'notin data.columns)or(c notin['debit','credit']): 5 msg ="Il vous manque la colonne '{}'. Attention aux majuscules "NameError: name 'data' is not defined
Merci bien pour votre retour??????????
Bonjour,
Il semble que votre variable "data" soit inexistante. êtes-vous sûr d'avoir bien chargé le csv dans la variable data ? pouvez-vous insérer "print(data)" juste avant la ligne "for c in['date_operation','libelle','debit','credit']:" ?
J'ai un souci avec le dernier code (Q4) du TP... il ne marche pas...Y'a un truc qui bug à partir de la fonction loc. J'essaie depuis hier de trouver d'où ça peut venir, mais je sèche un peu là...
---------------------------------------------------------------------------ValueError Traceback (most recent call last)
<ipython-input-22-d5b8a10a63d5> in <module>()----> 1iris.loc[i,"petal_width"]= Y # on remplace la valeur manquante par Y 2 lignes_modifiees.append(i) 3 print("On a complété petal_width par {} a partir de petal_length={}".format(Y,X))~\Anaconda3\lib\site-packages\pandas\core\indexing.py in __setitem__(self, key, value) 187 key = com._apply_if_callable(key, self.obj) 188 indexer = self._get_setitem_indexer(key)--> 189self._setitem_with_indexer(indexer, value) 190 191def _validate_key(self, key, axis):~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _setitem_with_indexer(self, indexer, value) 467 468if isinstance(value, ABCSeries):--> 469value = self._align_series(indexer, value) 470 471 info_idx = indexer[info_axis]~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _align_series(self, indexer, ser, multiindex_indexer) 775return ser.reindex(ax)._values
776--> 777raise ValueError('Incompatible indexer with Series') 778 779def _align_frame(self, indexer, df):ValueError: Incompatible indexer with Series
Ouvrez votre fichier avec un editeur qui gere l'encodage (genre sublimetext), et enregistrez votre fichier avec l'encodage utf-8 (File --> Save with encoding)
bonjour après avoir réussi l'importation de mon fichier perso j'ai saisie les lignes suivantes:
from collections import Counter
def most_common_words(labels):
words = []
for lab in labels:
words += lab.split(" ")
counter = Counter(words)
for word in counter.most_common(100):
print(word)
most_common_words(data['libelle'].values)
et j'ai le message suivant:
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-12-3c1cd7679545> in <module>()
8 for word in counter.most_common(100):
9 print(word)
---> 10 most_common_words(data['libelle'].values)
<ipython-input-12-3c1cd7679545> in most_common_words(labels)
4 words = []
5 for lab in labels:
----> 6 words += lab.split(" ")
7 counter = Counter(words)
8 for word in counter.most_common(100):
AttributeError: 'float' object has no attribute 'split'
j'aurais besoin d'aide pour resoudre cette erreur.
Ensuivant les instructions du cours de Nicolas, la constitution du fichier operations.enrichies.csv est arrivée au bout avec succès ! cependant j'ai ce message :
C:\Users\Garde\Anaconda3\ANACONDA bis\lib\site-packages\ipykernel_launcher.py:62: FutureWarning: `weekday_name` is deprecated and will be removed in a future version. Use `day_name` instead
Bonjour Aurélie, je suis également bloquée sur cette question Q4 du TP...
As tu reçue une réponse ou une piste qui t'a débloquée ?
Merci !
Alexandra
AurélieGiraud1 a écrit:
Bonjour Nicolas,
J'ai un souci avec le dernier code (Q4) du TP... il ne marche pas...Y'a un truc qui bug à partir de la fonction loc. J'essaie depuis hier de trouver d'où ça peut venir, mais je sèche un peu là...
---------------------------------------------------------------------------ValueError Traceback (most recent call last)
<ipython-input-22-d5b8a10a63d5> in <module>()----> 1iris.loc[i,"petal_width"]= Y # on remplace la valeur manquante par Y 2 lignes_modifiees.append(i) 3 print("On a complété petal_width par {} a partir de petal_length={}".format(Y,X))~\Anaconda3\lib\site-packages\pandas\core\indexing.py in __setitem__(self, key, value) 187 key = com._apply_if_callable(key, self.obj) 188 indexer = self._get_setitem_indexer(key)--> 189self._setitem_with_indexer(indexer, value) 190 191def _validate_key(self, key, axis):~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _setitem_with_indexer(self, indexer, value) 467 468if isinstance(value, ABCSeries):--> 469value = self._align_series(indexer, value) 470 471 info_idx = indexer[info_axis]~\Anaconda3\lib\site-packages\pandas\core\indexing.py in _align_series(self, indexer, ser, multiindex_indexer) 775return ser.reindex(ax)._values
776--> 777raise ValueError('Incompatible indexer with Series') 778 779def _align_frame(self, indexer, df):ValueError: Incompatible indexer with Series
Bonjour, je souhaite suivre ce cours en utilisant R et je voulais savoir s'il existait le pas à pas en R (comme celui proposé dans le cours pour Python). Qui serait plus facile à reproduire que d'ouvrir un fichier de type preprocessing.
Pouvez-vous me faire une capture d'écran du contenu de la variable iris et de la variable Y dans l'état dans lequel elles sont à cette ligne :
iris.loc[i,"petal_width"]= Y
Merci.
AurélieGiraud1 a écrit:
Bonjour Nicolas,
J'ai un souci avec le dernier code (Q4) du TP... il ne marche pas...Y'a un truc qui bug à partir de la fonction loc. J'essaie depuis hier de trouver d'où ça peut venir, mais je sèche un peu là...
Bonjour Alexandra, pour le warning, ce n'est pas grave, anaconda nous informe juste que dans les nouvelles versions du code à venir, il faudra penser à modifier 'weekday_name' en 'day_name' car weekday_name va être supprimée dans les prochaines versions (on dit qu'elle sera dépréciée). Cependant, elle reste encore active pour votre version actuelle d'anaconda.
AlexandraGardel a écrit:
Bonjour,
Ensuivant les instructions du cours de Nicolas, la constitution du fichier operations.enrichies.csv est arrivée au bout avec succès ! cependant j'ai ce message :
C:\Users\Garde\Anaconda3\ANACONDA bis\lib\site-packages\ipykernel_launcher.py:62: FutureWarning: `weekday_name` is deprecated and will be removed in a future version. Use `day_name` instead
Faut-il que je le prenne en compte et comment ?
Merci par avance,
(Nicolas, j'adore vos cours ! merci beaucoup)
Alexandra
Bonjour Anaïs, malheureusement il n'y a pas de version R pas-à-pas. Cepandant, les codes Python et R sont assez similaires et il devrait être assez simple de savoir quelle partie Python correspond à quelle partie en R. Utilisez-vous un notebook ou Rstudio pour exécuter les lignes de codes les unes après les autres pas-à-pas ?
AnaisRossetto a écrit:
Bonjour, je souhaite suivre ce cours en utilisant R et je voulais savoir s'il existait le pas à pas en R (comme celui proposé dans le cours pour Python). Qui serait plus facile à reproduire que d'ouvrir un fichier de type preprocessing.
J'ai ouvert les doc sur un bloc note. Je ne trouve pas qu'il soit facile de faire la transposition python sur R, sauf si on a déjà un bon niveau.
Personnellement j'ai essayé et je trouve cela trop difficile. (je suis plutôt débutant en R, je suis en parallèle un cours pour apprendre à l'utiliser mais je reste débutante.
je vais donc passer ce cours seulement du point de vue de la théorie mais c est dommage car les applications sont très utiles à la compréhension.Peut être une prochaine version en pas à pas ...
Je n'arrive pas à démarrer le notebook jupyter dans mon navigateur sur Win 10, ça se charge depuis des minutes sans rien afficher. Que faire , alors que mon installation sur Win 10 s'est bien passé( anaconda navigator démarre bien)?
J'ai deux petites questions sur la régression linéaire au niveau du code :
Pourquoi il y a-t-il une double [["..."']] pour la variable X.
A quoi correspond la ligne 4 ? J'ai bien essayé de l'enlever est on obtient le coefficient uniquement pour la variable "attente" avec un coeff différent.
Pour les sessions de "aller plus loin" de "La variance empirique corrigée" et "Calculs avec la variance empirique" du chapitre de "Comprenez les mesures de dispersion", j'ai du mal à comprendre des démonstrations de "variance empirique corrigée" et la relation de "vy = a2vx". Avez-vous d'autres démonstrations plus claires? En plus, je ne suis pas nulle en maths. Mais les démonstrations sont assez difficiles à interpreter. Vous remerciant par avance.
Pour le code "Voici le code affichant le tableau de contingence coloré", il manque l'import de seaborn pour exécuter le code sans erreur:
import seaborn as sns
tx = pd.DataFrame(tx)
ty = pd.DataFrame(ty)
tx.columns = ["foo"]
ty.columns = ["foo"]
n = len(data)
indep = tx.dot(ty.T) / n
c = c.fillna(0) # on remplace les valeurs nulles par des 0
mesure = (c-indep)**2/indep
xi_n = mesure.sum().sum()
sns.heatmap(mesure/xi_n,annot=c)
plt.show()
Je rencontre le même problème que Koumare Siriki : Je n'arrive pas à importer operations.csv sur mon Notebook Jupyter, qui existe bien et dans le même répertoire que mon script python
Hello Simon, pour faire simple, crée un dossier sur ton bureau où tu vas mettre ton jeu de données, ensuite ouvre ton notebook et tu verras les differents dossiers sur ton ordinateur. Par ex si ton bureau s'appel Desktop, tu verras desktop, clique dessus et tu vas voir le dossier que tu as crée qui contient ton jeu de données. Enfin, regarde dans les onglets de droite, tu verras "New" clique dessus et choisir "Python 3". Tu seras maintenat pret pour coder, par defaut, le nom de ton fichier sera "untitled.ipynb" tu peux le renommer apres. Ton jeu de données et ton code seront maintenant dans le meme dossier. C'est tout. Merci
Salut Koumare c'est moi qui te remercie. J'ai réussi à importer un autre dataset csv, cependant j'ai toujours le soucis avec operations.csv (séparateurs : points virgules); je pense que je devrais plutôt essayer de l'importer en txt
Tout d'abord merci pour ce cours, je viens de le terminer et il est très clair. J'aimerais en faire un notebook plus personnel, mais pour cela j'aimerais savoir si les données sont disponible sur une plateforme type kaggle ou autre ? Cela permettra à mon notebook de directement télécharger les données, et qu'il soit autoportant !
J'ai ajouté une précision dans le cours à ce sujet :
Une régression linéaire prédit une variable en fonction d'une ou plusieurs variables. sm.OLS s'attend donc à trouver une unique colonne (c-à-d un pd.Series ) en premier argument (ici Y), mais s'attend à trouver potentiellement plusieurs colonnes en 2nd argument (ici X, qui est un pd.DataFrame ). Pour sélectionner plusieurs colonnes d'un dataframe, on passe une liste de noms de colonnes. Et comme une liste s'écrit entre crochets, ceux-ci viennent s'ajouter aux crochers déjà présents !
ThomasLemoine2 a écrit:
Bonjour,
J'ai deux petites questions sur la régression linéaire au niveau du code :
Pourquoi il y a-t-il une double [["..."']] pour la variable X.
A quoi correspond la ligne 4 ? J'ai bien essayé de l'enlever est on obtient le coefficient uniquement pour la variable "attente" avec un coeff différent.
× Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
× Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
Aurelie GIRAUD
Data Analyst Student