Forums des Zéros

Une question ? Pas de panique, on va vous aider !

Liste des forums

Partage

Développement d'un crawler web

14 septembre 2016 à 23:01:20

Bonjour à tous,

pour un super projet il faut que je développe un crawler web capable si on lui donne un domaine ou un répertoire de parcourir les pages (X)HTML et stocker des méta-données dans une base de donnée.

Est-ce difficile à réaliser ? Quel langage utiliser, quelle bibliothèque ?

Merci pour vos réponses.

Stéréotaxiste

15 septembre 2016 à 3:49:28

Tu peux faire ça dans plein de langages, lesquels connais-tu déjà ?

Programmez un casse-brique 2D | Une API REST avec Symfony 3 | Pointeurs restreints en C

PyJav

15 septembre 2016 à 11:04:50

Tu peux le faire dans n'importe quel langage, j'ai personnellement une petite préférence pour Python.

Avec ses modules urllib3 et BeautifoulSoup, il est très facile de se connecter aux pages web et de filtrer le contenu en utilisant un parser HTML.

Développement d'un crawler web

× Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.

× Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.

Développement d'un crawler web

Développement d'un crawler web

Supprimer

Modérer

Signaler le message aux modérateurs