Partage
  • Partager sur Facebook
  • Partager sur Twitter

Meilleure méthode pour une action automatisée

    15 juin 2018 à 16:58:37

    Bonjour à tous! J'aurais besoin de votre avis sur une opération que j'ai besoin de réaliser dans le cadre d'un projet.

    Dans le code HTML d'une boutique en ligne, sur une page de résultats, je dois récupérer le nom du produit, son prix, et le lien qui mène vers sa page.

    Il faut que j'exporte cela sous forme de tableau dans un document.

    Selon vous quelle serait la meilleure méthode pour automatiser cette action?  Qui pourrait scanner toute la page et par exemple faire "dès que je tombe sur l'id 'nom', je met la suite de caractère qu'il y a après dans un tableau" etc. (c'est une piste que j'ai mais peut etre qu'il y a plus simple)

    Merci d'avance pour votre aide,

    ech064

    • Partager sur Facebook
    • Partager sur Twitter
      15 juin 2018 à 17:40:17

      Bonjour,

      Cela s'appelle, si j'ai bien compris, parser la page.

      Il y a plusieurs techniques que je connais mais en php :

      1) tu récupères la page via les fonctions cURL ou file_get_contents.

      2) la page récupérée est parsée : c'est à dire que tu cherches à trouver en fonction par exemple des tags html les infos que tu veux trouver. Toujours en php tu as des fonctions qui permettent d'analyser le DOM :  http://php.net/manual/fr/class.domdocument.php

      A+

      -
      Edité par monkey3d 17 juin 2018 à 21:03:48

      • Partager sur Facebook
      • Partager sur Twitter
        17 juin 2018 à 1:29:59

        Merci pour la réponse,
        Je dois faire cela sur n'importe quelle boutique en ligne que l'on me donne. Comment faire pour exécuter du PHP sur une page quelconque ?
        • Partager sur Facebook
        • Partager sur Twitter
          17 juin 2018 à 8:50:14

          Tu ne peux pas, d'ailleurs je me demandais si c'était en JS ou en PHP que tu voulais analyser ta page. Le principe reste le même: Tu charges une page, tu récupères le pattern et après tu analyses.

          Par contre je ne sais pas si tu as un langage imposé, mais en JS ce sera un peu trop compliqué à faire (Tu fais une méthode de parsing mais que tu devras recharger pour chaque page de résultat)

          • Partager sur Facebook
          • Partager sur Twitter
            17 juin 2018 à 21:03:35

            Je t'ai donné le principe ci-dessus en php :

            1.- tu récupères la page : peu importe la page.

            2.- Tu parses la page. là c'est spécifique à la page récupérée puisque tu dois chercher quelque chose qui caractérise la page. Bon il y a le tag <title> qui est générique mais qui n'apporte pas grand chose.

            A+

            • Partager sur Facebook
            • Partager sur Twitter

            Meilleure méthode pour une action automatisée

            × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
            × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
            • Editeur
            • Markdown