Partage
  • Partager sur Facebook
  • Partager sur Twitter

Développement d'un crawler web

    14 septembre 2016 à 23:01:20

    Bonjour à tous,

    pour un super projet il faut que je développe un crawler web capable si on lui donne un domaine ou un répertoire de parcourir les pages (X)HTML et stocker des méta-données dans une base de donnée.

    Est-ce difficile à réaliser ? Quel langage utiliser, quelle bibliothèque ?

    Merci pour vos réponses. :)

    • Partager sur Facebook
    • Partager sur Twitter
      15 septembre 2016 à 11:04:50

      Tu peux le faire dans n'importe quel langage, j'ai personnellement une petite préférence pour Python.

      Avec ses modules urllib3 et BeautifoulSoup, il est très facile de se connecter aux pages web et de filtrer le contenu en utilisant un parser HTML.

      • Partager sur Facebook
      • Partager sur Twitter

      Développement d'un crawler web

      × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
      × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
      • Editeur
      • Markdown