Partage
  • Partager sur Facebook
  • Partager sur Twitter

Scraper

Cours : Analysez vos données textuelles

    27 août 2019 à 11:08:18

    Bonjour.

    L'auteur du cours traite du natural language processing sur la base des vers de rappeurs français.

    Je présume qu'à cause des droits d'auteur, on ne peut nous donner la base de données utilisée mais il nous invite à scrapper Wikipédia puis Genius afin de récupérer les paroles.

    J'ai cherché un peu sur internet pour fabriquer ce scraper mais si je continue, je vais y passer 3 mois (et je préférerais avancer sur le NLP à cet instant) donc si quelqu'un avait un morceau de code se rapprochant de ce qui pourrait être intéressant dans ce cas de figure, pourrait-il le partager ?

    Cela permettrait d'utiliser le code de traitement du langage fourni dans le cours.

    Merci.

    • Partager sur Facebook
    • Partager sur Twitter
      27 août 2019 à 11:39:19

      Franchement, ce n'est pas indispensable.

      Comme toi, je préfère toujours taper moi-même les bouts de code donnés dans le cours, mais ce n'est pas la peine de rester bloquer là-dessus.
      L'activité de fin de cours demande nettement plus de boulot et pour le coup, ça vaut la peine que tu concentres tes forces dessus.

      • Partager sur Facebook
      • Partager sur Twitter
        27 août 2019 à 15:43:27

        J'ai compris, malgré l'absence d'explications détaillées, la structure de ces différents dictionnaires db et artistes.

        Cela aurait surtout été l'occasion de "revoir" un scraper avec une partie "défilement de pages" et "recherche de nom" je présume.

        Là, j'essaye désespérément de finir la 1ère activité mais j'ai plein de tuiles. Alors si en plus la 2ème activité est compliquée... youhou o_O

        • Partager sur Facebook
        • Partager sur Twitter

        Scraper

        × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
        × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
        • Editeur
        • Markdown