Partage
  • Partager sur Facebook
  • Partager sur Twitter

Récupérer le contenu d'une balise

Selenium

23 septembre 2020 à 10:49:52

Bonjour,

Alors voilà, je suis "débutant" en python et j'aimerais pouvoir récupérer les valeurs de certaines balises sur le web et les rentrer dans un fichier Excel.

Par exemple, 

<div id=text> Voici du texte </div>

Je voudrais récupérer le texte de cette div et le mettre dans une feuille Excel.

J'ai trouver une solution nommer le Web Scrapping, avec des bibliothèques comme BeautifulSoup4 ou Scrapy mais je trouve ces notions un peu compliquées et j'aimerais savoir si il existe d'autre moyens pour obtenir un résultat similaire ? 

Merci d'avance.

  • Partager sur Facebook
  • Partager sur Twitter
23 septembre 2020 à 11:55:49

une autre solution (pas forcément meilleure) est d'utiliser urllip pour récupérer le code de la page dans une chaine et de traiter ensuite cette chaine (mais je pense que c'est refaire ce que fait les bibliothèques de webscrapping.
Cf https://python.developpez.com/cours/DiveIntoPython/php/frdiveintopython/html_processing/extracting_data.php pour urllib
  • Partager sur Facebook
  • Partager sur Twitter
23 septembre 2020 à 12:11:52

Merci pour les réponses, je vais essayer de me mettre au WebScrapping alors.

Bonne journée à vous

  • Partager sur Facebook
  • Partager sur Twitter
28 juin 2024 à 12:51:35 - Message modéré pour le motif suivant : Merci d’utiliser le bouton code pour insérer un code sur le forum


28 juin 2024 à 13:17:24

@ElfridaYEMADJE Bonjour, merci de ne pas squatter le sujet des autres, créer votre propre sujet dans le respect des règles du forum à savoir qu'un message commence par des règles de politesses (Un bonjour ou des salutations à la communauté et se termine par des remerciements par avances pour les futures réponses), la description de votre problème et le code que vous avez écrit inséré sur le forum à l'aide de l'outil d'intégration de code soit le bouton code </>.

Déterrage

Citation des règles générales du forum :

Avant de poster un message, vérifiez la date du sujet dans lequel vous comptiez intervenir.

Si le dernier message sur le sujet date de plus de deux mois, mieux vaut ne pas répondre.
En effet, le déterrage d'un sujet nuit au bon fonctionnement du forum, et l'informatique pouvant grandement changer en quelques mois il n'est donc que rarement pertinent de déterrer un vieux sujet.

Au lieu de déterrer un sujet il est préférable :

  • soit de contacter directement le membre voulu par messagerie privée en cliquant sur son pseudonyme pour accéder à sa page profil, puis sur le lien "Ecrire un message"
  • soit de créer un nouveau sujet décrivant votre propre contexte
  • ne pas répondre à un déterrage et le signaler à la modération

Liens conseillés

Je ferme ici.

  • Partager sur Facebook
  • Partager sur Twitter