Partage
  • Partager sur Facebook
  • Partager sur Twitter

"data-url" d'une div avec BeautifulSoup

Sujet résolu
    13 février 2017 à 19:24:11

    Bonjour,

    Je chercher à récupérer toutes les valeurs de l'attribut "data-url" avec la librairie "BeautifulSoup".

    Voici mon code :

    from BeautifulSoup import BeautifulSoup as BS
    import urllib, urllib2, re
    import csv
    
    try:
    
        url = 'mon-url.fr'
        data = {"param1": "3246", "param2": "RECHERCHER"}
        data = urllib.urlencode(data)
    
        req = urllib2.Request(url, data)
        response = urllib2.urlopen(req)
    
        html_code = response.read()
        data_soup = BS(html_code);
    
        links = data_soup.find_all('div')
    
        for r in links:
            print (r.get('data-url'))
    
        #[item['data-url'] for item in data_soup.find_all('div', attrs={'data-url' : True})]
    
        print links
    
        fp.close()
    
    finally:
        ...
    
    
    Exemple d'html :
    <div class="liste" data-url="http://blablabla.fr/564.html">
     

    J'ai essayé plusieurs versions de code sans succès.

    Quelqu'un a déjà fait çà svp ? :)

    Merci

    F.

    -
    Edité par __fabrice 13 février 2017 à 19:28:08

    • Partager sur Facebook
    • Partager sur Twitter
    Anonyme
      13 février 2017 à 19:59:51

      Peut-être (à tester)

      print data_soup.div['data-url']

      tout simplement... voir doc au cas où c'est pas fonctionnel !

      • Partager sur Facebook
      • Partager sur Twitter
        13 février 2017 à 21:13:49

        Merci, mais j'ai eu la réponse en cherchant un peu :) :

        links = data_soup.findAll('div', attrs={'data-url': True})
        
            for link in links:
                companies.writerow([link.get('data-url')])

        F.

        • Partager sur Facebook
        • Partager sur Twitter

        "data-url" d'une div avec BeautifulSoup

        × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
        × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
        • Editeur
        • Markdown