Partage
  • Partager sur Facebook
  • Partager sur Twitter

[Expression Régulière] Tout, sauf des extensions

Récupérer tout les liens sauf celle avec une certaine extension

    16 décembre 2015 à 16:55:10

    Bonjour,

    Pour la réalisation d'un TP en cours, je dois créer une application.

    Malheureusement je bloque à un endroit. Je n'arrive pas à récupérer tous les liens situés dans des href (de la balise 'a' en HTML) sauf celles avec les extensions .css, .xml, .png...

    Voici se que j'ai réussi à faire (en m'aidant d'internet ;)), c'est du python :

    liens = re.findall('(href="(.*?)")', pageWeb)

    Ça marche bien, malheureusement ça m'en récupère trop... J'ai essayé avec les (?!\.css), ^\.css et plein d'autres dérivés mais il me prend toujours tout...

    Est-ce que quelqu'un peut me guider svp ?

    Merci d'avance !

    -
    Edité par Menthalooh 16 décembre 2015 à 16:56:02

    • Partager sur Facebook
    • Partager sur Twitter

    [Expression Régulière] Tout, sauf des extensions

    × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
    × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
    • Editeur
    • Markdown