[BeautifulSoup] Extraire les bonnes données ? par Joyako - page 1

Bonjour,

Je cherche a remplir une base de données aves les résultats des courses cyclistes professionnelles de 2016. Pour cela je prévoie de récupérer les données du site ProCyclingStats via le module BeautifulSoup de Python.

Par exemple dans cette page ( http://www.procyclingstats.com/race.php?id=163234 ), Je veux récupérer les noms des coureurs (dans l'ordre, ou bien avec leurs places respectives).

J'utilise le module urllib pour récupérer le code source, puis je le traite avec BeautifulSoup.

Seulement, en faisant des essais je n'ai jamais réussi à retourner ce qui m'intéresse (à partir de la l91 dans le code).

Avec des find_all('a'),(href=re.compile('rider')), ou (class_='rider '), soit il ne me retourne rien, soit il retourne les tags de coureurs situés tout en bas de page et qui n'ont rien à voir, j'ai essayé plain d'autres combinaisons mais rien ne marche.

Du coup je pense qu'il y a quelque chose que je n'ai pas bien compris avec bsoup, et mon find_all est trop naïf (il faudrait utiliser une fonction dedans ? auquel cas je sais pas trop comment faire)

Je suis preneur pour tout espèce d'idée

[BeautifulSoup] Extraire les bonnes données ?

[BeautifulSoup] Extraire les bonnes données ?

Supprimer

Modérer

Signaler le message aux modérateurs