bonjour, ou bonsoir à tous, voila, je suis a la recherche d'une réponse, je tante de récupérer une url qui se trouve dans une balise <a href="line"</a>
pour récupérer mon lien:
if res.ok: liens = soup.findAll("h3")#, {"href":"title"}) for n in liens: a = n.find("a") print(a)
or mon problème est que cela m'affiche toute la balise a, comment récupérer uniquement le lien qui se trouve juste après "href"?
On peut faire autrement, mais ça me tentait ... Dans le cas des liens <a href ...> on peut le faire comme suit: Je pense que les url ne peuvent pas avoir de " ou de : dans leur texte. b=a.split('"')[1] ou encore en plus long ... i=a.index('"')+1 j=a[i:].index('"') b=a[i:i+j] Pour extraire le nom sans le http: b=a.split(':')[1][2:-1] Les expressions régulières pourraient servir si la balise contient des codes CSS difficiles à séparer.
Le Tout est souvent plus grand que la somme de ses parties.
merci pour vos solutions, elles m'ont bien aidé, et débloqué, pour info j'ai retenu celle de LoupSolitaire qui suit la logique de mon code, mais merci a tout le monde, ça m'agrandit l'éventail de chose apprise
récupération url uniquement
× Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
× Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
Le Tout est souvent plus grand que la somme de ses parties.
Blond, bouclé, toujours le sourire aux lèvres...
Le Tout est souvent plus grand que la somme de ses parties.