Partage
  • Partager sur Facebook
  • Partager sur Twitter

"from tools import ap" ????

Cours : Analysez vos données textuelles

    27 août 2019 à 18:07:37

    Bonjour.

    Bon... j'ai cherché pendant 10 min mais là, je donne ma langue au chat.

    Quelqu'un pourrait-il m'expliquer ce qu'est ce "module" "tools" et la fonction "ap" que le jupyter notebook ne connaît pas ?

    Par quoi je le remplace pour que cela fonctionne, sachant qu'il ait dit dans la vidéo (partie 3, chapitre 1) que le "ap" s'applique à l'adresse du site "imdb", ce qui aurait donc valeur d'url ?

    Merci pour vos suggestions ou réponses.

    • Partager sur Facebook
    • Partager sur Twitter
      8 octobre 2020 à 11:20:23

      Bonjour, 

      plus d'un an après je vois que ce point n'a pas obtenu de réponse, dommage d'avoir à improviser un debug et difficile d'exploiter le code du cours dans ce cas,

      en alternative pour celles et ceux qui chercheraient en vain, la doc  nltk est up to date et complète

      http://www.nltk.org/api/nltk.classify.html#module-nltk.classify.naivebayes

      il est possible de jouer une démo, modulo l'import de nltk.download('names')

      ensuite, une mine d'info est le ch06 6. Learning to Classify Text

      https://www.nltk.org/book/ch06.html

      je ne suis pas allé plus loin !

      • Partager sur Facebook
      • Partager sur Twitter

      Etienne Lardeur - Parcours DS

        6 janvier 2021 à 19:14:41

        Bonjour,

        Je suis en train de suivre le même cours, et j'ai le même problème:

        "cannot import name 'ap' from 'tools'"

        En recherchant sur Google, je trouve seulement 2 pages internet ayant écrit exactement "from tools import ap": ce sont vos deux commentaires.

        J'en déduis donc que le cours doit-être erroné.

        Qu'on fait les autres étudiants?

        Cordialement,

        Edward Levavasseur, parcours Ingénieur Machine Learning

        • Partager sur Facebook
        • Partager sur Twitter
          15 septembre 2021 à 15:51:50

          Bonjour,

          Il est vrais que le cours est incomplet et que le code et impossible à exploiter en l'état.

          Pour réaliser le TP il suffit de comprendre le fonctionnement du code et où il était nécessaire d'aller (quel résultat obtenir...)

          j'ai recréer les méthodes pour le besoin du TP, en préambule, il est nécessaire de télécharger le code associé au cours sur standford.edu.

          Après j'ai essayé ce code qui fonctionne correctement (modifier le format_review si nécessaire, il est nécessaire d'importer que "nltk" et "os"):

          def format_review(review):

              return nltk.word_tokenize(review)

          def get_all_text_formated(path):

              training = []

              for file in os.listdir(path + "pos/"):

                  try:

                      with open(path + "pos/" + file, encoding="UTF-8") as line:

                          for word in format_review(line.readline()):

                              training.append(({word:True},"pos"))

                  except:

                      print("error on file name :",file)

              for file in os.listdir(path + "neg/"):

                  try:

                      with open(path + "neg/" + file, encoding="UTF-8") as line:

                          for word in format_review(line.readline()):

                              training.append(({word:True},"neg"))

                  except:

                      print("error on file name :",file)

              return training

          le paramètre `path` est le répertoire racine du jeu de donnée DL sur standford.edu jusqu'a "../train/" ou "../test/" et l'algo vas ensuite chercher dans le dossier "pos/" et "neg/" toutes les reviews clients sur les films.

          Le "NaivesBayesClassifier" à besoin de feature sous la forme suivante : ({ word : True }, label)

          Cordialement,

          Seb_T

          • Partager sur Facebook
          • Partager sur Twitter

          "from tools import ap" ????

          × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
          • Editeur
          • Markdown