Après avoir suivi les cours sur python, je souhaiterai pour le fun, créer un programme de récupération de certains cours de bourse sur Boursorama. J' ai bien ouvert la page du code source d' un titre, mais je ne vois pas comment aller chercher les informations.
La date serait la date du jour.
Cours le plus bas
Cours le plus haut,
Cours à la fermeture
Écart par rapport à la veille
Volume traité.
Pour ce qui est de les enregistrer dans un fichier.csv ou .txt, pas de soucis.
une solution serait de passer par du webscrapping (récupérer les données via les balises html de la page); celles qui t'intéresseraient seraient les balises de classe c-faceplate__data et ses descendants ou plus directement la classe c-list-info__item
J' ai épluché la page HTML du site de Boursorama. Effectivement, en utilisant la classe c-list-info__item, on retrouve les différentes données d' un titre. Il me semble intéressant d" utiliser les bibliothèques Beutiful et Request.
Par ailleurs, j' ai vu que l'on pouvait également utiliser urllib3 et urlopen.
Par contre, je ne suis pas sûr de comprendre comment pointer sur une ligne précise de la page HTML.
Toujours sur mon essai d' extraction de données d' une page web, je bute sur la syntaxe. Mea culpa, débutant en python, j' ai été sûrement un peu présomptueux de me lancer dans ce projet.
Grace au différends tutos, j' ai retrouvé dans la page web une des données que je cherche à extraire. Voici un exemple du fichier htlm.
La syntaxe est incorrecte mais je n' ai pas trouvé de doc pour résoudre ce problème. Pourtant, les exemples ne manquent pas mais pas aussi profondément que dans ce cas.
Merci beaucoup de votre aide. J' ai pus avancer dans ce projet. Toutefois j' ai encore des erreurs. Je viens de trouver une documentation plus complète sur BeautfulSoup4. Bon elle est en anglais mais je vais tenter de la traduire pour aller plus loin.
Grace à l' aide de umfred, je peux récupérer les cours. Toutefois, cela n' est pas totalement satisfaisant. En effet, les données importées avec ".c-instrument" sont des données arrondies. Par contre, "data-faceplate" permet de ramener les données exactes de la page. Pour une bonne compréhension de ma recherche, je joins ci-dessous la partie de la page à extraire:
Je rajoute high parce que je cherche à extraire la valeur contenu dans cette !! balise!! si on peut parler de balise. Au même titre que l' on peut tenter d' extraire la valeur de low, previous etc..
Tu peux pas récupérer la valeur de "high" directement avec beautifulsoup. Il faut d'abord récupérer le contenu de 'data-ist-init'. Cet attribut contient du JSON donc ce sera facile à lire avec le module json.
Lis un peu de doc sur le HTML, ça te servira parce que là j'ai l'impression que tu ne fais pas la différence entre le code HTML et son contenu.
Après j'ai réussi à faire marcher ça chez moi en corrigeant ton bout de HTML parce qu'il est pas correct (manque guillemets, crochets et balises fermantes) :
Merci beaucoup à vous deux. Effectivement, il fallait commencer par récupérer la liste de données dans une variable. Ensuite, travailler cette variable pour extraire les éléments recherchés.
Mon erreur était de vouloir aller chercher l' information directement.
Merci encore et bonne soirée.
Cours bourse Boursorama
× Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
× Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
on récupère le texte de la valeur
Blond, bouclé, toujours le sourire aux lèvres...
Blond, bouclé, toujours le sourire aux lèvres...
Blond, bouclé, toujours le sourire aux lèvres...