Bon... j'ai cherché pendant 10 min mais là, je donne ma langue au chat.
Quelqu'un pourrait-il m'expliquer ce qu'est ce "module" "tools" et la fonction "ap" que le jupyter notebook ne connaît pas ?
Par quoi je le remplace pour que cela fonctionne, sachant qu'il ait dit dans la vidéo (partie 3, chapitre 1) que le "ap" s'applique à l'adresse du site "imdb", ce qui aurait donc valeur d'url ?
plus d'un an après je vois que ce point n'a pas obtenu de réponse, dommage d'avoir à improviser un debug et difficile d'exploiter le code du cours dans ce cas,
en alternative pour celles et ceux qui chercheraient en vain, la doc nltk est up to date et complète
Il est vrais que le cours est incomplet et que le code et impossible à exploiter en l'état.
Pour réaliser le TP il suffit de comprendre le fonctionnement du code et où il était nécessaire d'aller (quel résultat obtenir...)
j'ai recréer les méthodes pour le besoin du TP, en préambule, il est nécessaire de télécharger le code associé au cours sur standford.edu.
Après j'ai essayé ce code qui fonctionne correctement (modifier le format_review si nécessaire, il est nécessaire d'importer que "nltk" et "os"):
def format_review(review):
return nltk.word_tokenize(review)
def get_all_text_formated(path):
training = []
for file in os.listdir(path + "pos/"):
try:
with open(path + "pos/" + file, encoding="UTF-8") as line:
for word in format_review(line.readline()):
training.append(({word:True},"pos"))
except:
print("error on file name :",file)
for file in os.listdir(path + "neg/"):
try:
with open(path + "neg/" + file, encoding="UTF-8") as line:
for word in format_review(line.readline()):
training.append(({word:True},"neg"))
except:
print("error on file name :",file)
return training
le paramètre `path` est le répertoire racine du jeu de donnée DL sur standford.edu jusqu'a "../train/" ou "../test/" et l'algo vas ensuite chercher dans le dossier "pos/" et "neg/" toutes les reviews clients sur les films.
Le "NaivesBayesClassifier" à besoin de feature sous la forme suivante : ({ word : True }, label)
@MelessGnagne Bonjour, c'est bien de répondre à un sujet, le faire dans les règles du forum c'est mieux. Merci d'utiliser le bouton code </> de la barre d'outil, pour insérer un code sur le forum.
Avant de poster un message, vérifiez la date du sujet dans lequel vous comptiez intervenir.
Si le dernier message sur le sujet date de plus de deux mois, mieux vaut ne pas répondre. En effet, le déterrage d'un sujet nuit au bon fonctionnement du forum, et l'informatique pouvant grandement changer en quelques mois il n'est donc que rarement pertinent de déterrer un vieux sujet.
Au lieu de déterrer un sujet il est préférable :
soit de contacter directement le membre voulu par messagerie privée en cliquant sur son pseudonyme pour accéder à sa page profil, puis sur le lien "Ecrire un message"
soit de créer un nouveau sujet décrivant votre propre contexte
ne pas répondre à un déterrage et le signaler à la modération
Etienne Lardeur - Parcours DS