Partage
  • Partager sur Facebook
  • Partager sur Twitter

utiliser selenium pour tor

    31 juillet 2021 à 23:50:25

    Bonjour je cherche a faire du webscraping sur tor en utilisant selenium, helas j'ai enormement de mal ne serais ce qu'a lancer Tor.

    Ici cela me dit que mon nom de repertoire est invalide alors qu'il est bon:

    from selenium import webdriver
    
    PATH = "D:\Programmes\Tor Browser\Start Tor Browser.lnk"
    driver = webdriver.Firefox(PATH)
    
    driver.get("www.google.com")

    Cela doit surement venir du fait que pour lancer tor ça doit etre different, ici j'ai bidouiller le code de quelqu'un avec qui ça marchait pour chrome, mais je ne vois pas pourquoi ça ne fonctionnerait pas...

    merci d'avance

    • Partager sur Facebook
    • Partager sur Twitter
      1 août 2021 à 10:48:03

      oui il me sempble. j'ai une errueur qui est : [WinError 267] Nom de répertoire non valide: 'D:\\Programmes\\Tor Browser\\Start Tor Browser.lnk'

      Pourtant je suis sur que mon chemin est le bon

      • Partager sur Facebook
      • Partager sur Twitter
        1 août 2021 à 10:59:18

        Sur le lien que je te donne, le PATH en question n'est pas ton chemin D:machinchose. C'est le PATH de python que tu as configuré à son installation. Tu dois télécharger et dézipper le geckodriver puis le placer dans le PATH python.

        Et met un r juste devant ton string : comme ça : r"D:\..."

        Ça veut dire raw, parce que l'antislash \ est un caractère d'échappement.

        La preuve, tes antislashes sont doublés.

        Par contre, sur linux, je viens de tester ton PATH, avec ou sans r devant, j'ai le même résultat : antislashes doublés.

        bon, la solution est de doubler les antislashes dans ton PATH ligne 3 ou d'utiliser os.path.join(

        -
        Edité par CristianoRolando 1 août 2021 à 11:11:03

        • Partager sur Facebook
        • Partager sur Twitter
          1 août 2021 à 11:24:25

          j'essaie de suivre plusieur tuto mais je n'arrive pas a mettre geckodriver dans le PATH pyton et il me semble que je dois mettre tor dedans aussi

          • Partager sur Facebook
          • Partager sur Twitter
            1 août 2021 à 11:28:42

            Pour tor, je sais pas, ma partition est pleine, je peux pas le DL.

            Mais, double les antislashes dans ton PATH pour voir.

            Fais le test dans l'interpréteur :

            PATH = "D:\\Progs\\Tor\\faire\\truc\\illegal"
            print(PATH) # doit donner ci-dessous :
            # "D:\Progs\Tor\faire\truc\illegal"



            • Partager sur Facebook
            • Partager sur Twitter
              1 août 2021 à 11:31:50

              voici l'erreur [WinError 267] Nom de répertoire non valide: 'D:\\\\Programmes\\\\Tor Browser\\\\Start Tor Browser.lnk'

              • Partager sur Facebook
              • Partager sur Twitter
                1 août 2021 à 11:37:55

                Ah ! C'est pire qu'avant.

                Chez moi, ça donne bien le code que j'ai posté il y a 5 minutes.

                Passe par os.path.join()

                essaie (PAS dans ton script selenium !) : os.path.join("D:\\","Programmes\\", ... , "Start Tor Browser.lnk")

                • Partager sur Facebook
                • Partager sur Twitter
                  1 août 2021 à 11:42:14

                  Je dois faire ça dans la console python?

                  ps: je pense que j'ai reussi a mettre geckodriver et tor dans le PATH python

                  • Partager sur Facebook
                  • Partager sur Twitter
                    1 août 2021 à 11:44:44

                    la console python te sert à tester tes essais. Tu as j'espère remarqué que le message d'erreur ajoutait des antislashes ? voici l'erreur [WinError 267] Nom de répertoire non valide: 'D:\\\\Programmes\\\\Tor Browser\\\\Start Tor Browser.lnk'
                    • Partager sur Facebook
                    • Partager sur Twitter
                      1 août 2021 à 11:46:15

                      HEIIIIN je viens de comprendre j'ai refais le

                      PATH = "D:\Programmes\Tor Browser\Start Tor Browser.lnk"
                      print(PATH)


                      et cela m'a bien donné:

                      D:\Programmes\Tor Browser\Start Tor Browser.lnk
                      donc c'est bon

                      -
                      Edité par FaustinQUINTANE1 1 août 2021 à 11:52:33

                      • Partager sur Facebook
                      • Partager sur Twitter
                        1 août 2021 à 12:13:22

                        Un fichier LNK est un raccourci (link), ce n'est ni un dossier ni un exécutable.

                        • Partager sur Facebook
                        • Partager sur Twitter
                          1 août 2021 à 12:14:27

                          HEIIIIN je viens de comprendre j'ai refais le
                          PATH = "D:\Programmes\Tor Browser\Start Tor Browser.lnk"
                          print(PATH)


                          et cela m'a bien donné:

                          D:\Programmes\Tor Browser\Start Tor Browser.lnk

                          donc c'est bon

                          • Partager sur Facebook
                          • Partager sur Twitter
                            1 août 2021 à 15:29:11

                            Ton doublon sert à rien, faut pas faire un autre post.

                            Mais HD1 a raison, et t'as la même erreur dans l'autre post. Ton PATH doit être un répertoire.

                            • Partager sur Facebook
                            • Partager sur Twitter
                              1 août 2021 à 18:16:50

                              Ok j'ai essaye de faire autrement

                              from tbselenium.tbdriver import TorBrowserDriver
                              with TorBrowserDriver(r"D:\Programmes\Tor Browser\Browser") as driver:
                                  driver.get('https://check.torproject.org')


                              mais j'ai toujours des probleme (de PATH je crois) donc j'ai essayé de changer les redirection etc.. et j'ai deux erreur qui reviennent:

                              celle la: tbselenium.exceptions.TBDriverPathError: Invalid Firefox binary D:\Programmes\Tor Browser\Browser\Browser\firefox

                              ou celle la : tbselenium.exceptions.TBDriverPathError: TBB path is not a directory D:\Programmes\Tor Browser\Browser\firefox.exe

                              la deuxieme c'est quand je met l'executable je crois

                              • Partager sur Facebook
                              • Partager sur Twitter
                                1 août 2021 à 21:35:13

                                C'est quoi tes tutos Selenium ?

                                Mon lien est une doc fiable : les readthedocs.io font de très bonne doc complète. Tu peux compléter avec une doc Tor et Selenium.

                                Et surtout, fais un test sur Firefox sans Tor (ou un autre navigateur Web). Ainsi, si sur FF ça fonctionne mais pas sur Tor, tu auras isolé le soucis sur Tor.

                                Pour l'erreur : tbselenium.exceptions.TBDriverPathError: TBB path is not a directory D:\Programmes\Tor Browser\Browser\firefox.exe. L'erreur est claire.

                                Pour : tbselenium.exceptions.TBDriverPathError: Invalid Firefox binary D:\Programmes\Tor Browser\Browser\Browser\firefox. Je t'enjoins à lire ces sujets GH et SO :

                                https://github.com/webfp/tor-browser-selenium/issues/101

                                https://github.com/webfp/tor-browser-selenium/issues/107

                                https://stackoverflow.com/questions/56052021/which-is-the-valid-firefox-binary-path-for-python-tbselenium

                                https://stackoverflow.com/questions/61317817/error-while-opening-tor-browser-using-pyhton-selenium-firefoxdriver

                                https://stackoverflow.com/questions/47782650/selenium-common-exceptions-sessionnotcreatedexception-message-unable-to-find-a/47785513

                                https://stackoverflow.com/questions/53942553/how-to-connect-to-tor-browser-using-python

                                Regarde bien les dates, privilégie les sujets les plus récents, et mets à jour tes logiciels : pip, FF, Tor, Selenium, ...

                                • Partager sur Facebook
                                • Partager sur Twitter
                                  2 août 2021 à 15:55:04

                                  Merci beaucoup de votre aide, j'ai reussi a faire marcher firefox ce qui m'a fait comprendre pas mal de truc, ducoup j'ai fait un nouveau code pour ressayer d'utiliser Tor avec selenium, voici mon code:
                                  import time
                                  from tbselenium.tbdriver import TorBrowserDriver
                                  
                                  TorBrowserDriver(executable_path=r'D:\Programmes\WebDriver\bin\geckodriver.exe')
                                  
                                  with TorBrowserDriver(r"D:\Programmes\Tor Browser\Browser\firefox.exe") as driver:
                                      driver.get('https://www.google.com/')
                                      time.sleep(5)

                                  Helas j'ai toujours une erreur(que je n'avais jamais eu auparavant ): Either TBB path or Firefox profile and binary path should be provided

                                  pourtant j'ai l'impression d'avoir bien fait, j'ai suivi ce tuto: https://github.com/webfp/tor-browser-selenium

                                  • Partager sur Facebook
                                  • Partager sur Twitter

                                  utiliser selenium pour tor

                                  × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                                  × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
                                  • Editeur
                                  • Markdown