Partage
  • Partager sur Facebook
  • Partager sur Twitter

Aucune output de ce program

    17 janvier 2024 à 21:49:02

    Bonjour,

    j'ai essayé ce programme (décoder un web site)

    en l'exécutant aucun output ni erreur est ce que c'est normal?

    pour avoir output que je dois corrigér

    import requests
    from bs4 import BeautifulSoup
    base_url = 'http://www.nytimes.com'
    r = requests.get(base_url)
    soup = BeautifulSoup(r.text, features="html.parser")
    for story_heading in soup.find_all(class_="story-heading"):
        if story_heading.a:
            print(story_heading.a.text.replace("\n", " ").strip())
        else:
            print(story_heading.contents[0].strip())



    • Partager sur Facebook
    • Partager sur Twitter
      18 janvier 2024 à 10:22:43

      Bonjour,

      Ça m'étonnerai qu'un site comme le New York Times n'est pas bloqué le scraping sur leur site.

      Ils ont une API permettant de communiquer et récupérer les informations.

      et un module python existe déjà pour vous éviter tout ces tracas.

      • Partager sur Facebook
      • Partager sur Twitter

      Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
      La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)

        18 janvier 2024 à 14:16:08

        xavierdominique a écrit:

        en l'exécutant aucun output ni erreur est ce que c'est normal?

        Une boucle disant "pour chaque item de la collection afficher ..." qui n'affiche rien... suggère que la collection est vide:

        >>> for z in []:
        ...     print('****')
        ...
        >>>

        Et pour corriger, il faut chercher des choses qui existent dans la page Web et donc se farcir du HTML (et pas du python).

        • Partager sur Facebook
        • Partager sur Twitter
          18 janvier 2024 à 15:17:34

          Salut,

          Comme le dit @mps, si tu avais fouillé le code HTML, tu aurais compris que la classe "story-heading" n'existe pas ou plus...

          Celle qui pourrait faire le job s'appelle "story-wrapper"

          • Partager sur Facebook
          • Partager sur Twitter

          Aucune output de ce program

          × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
          • Editeur
          • Markdown