J'essaye de scraper la page d'un article sur METRO.fr mais quand j'utilise le module requests je n'ai pas tout le contenu de la page et cela me renvoie un message d'erreur (URL invalide) alors que le l'URL est valide. Je ne sais pas si j'utilise les bons "headers", y a t-il un moyen de scraper le site sans utiliser Selenium ?
Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard) La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)
Peut-être une protection, type CAPTCHA, IP Blacklisting, ... ?
Tu devrais chercher du côté des API pour metro.fr, et si tu n'en trouves pas, je vois guère de solution.
Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard) La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)
Scraping - Invalid URL
× Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)
Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)