Partage
  • Partager sur Facebook
  • Partager sur Twitter

OCR Rib/CNI/Passeport

    9 janvier 2020 à 16:18:14

    Bonjour à tous,

    On m'a chargé de rechercher des solutions d'OCR pour effectuer de la lecture de RIB, CNI, Passeport.

    C'est à dire, à partir d'un scan ou d'une photo d'un RIB/CNI/Passeport, récupérer un JSON (ou autre) contenant l'ensemble des informations.

    Je me permets de vous interpeller dans le cas où vous auriez travaillez avec une solution de ce type par le passé, et le cas échéant, vous demandez quelle librairie avez vous utilisé et quel retour pourriez vous me faire à ce niveau ?

    Je cherche de mon côté mais ce segment de l'informatique est très feuillu, les sites pas forcément très explicites/ bien faits.

    • Partager sur Facebook
    • Partager sur Twitter
      13 janvier 2020 à 11:40:24

      Salut,

      ça dépend ce que tu cherches. 

      Un truc tout prêt qui te renvoie les infos "pertinentes" que tu veux ?

      Un truc qui renvoi juste un JSON du texte brut de l'image, avec les coordonnées ? 

      Dans quelle technologies ? 

      Payant ou gratuit ?

      J'ai beaucoup travaillé sur ce genre de projet, mais les solutions vont êtres très différentes suivant tes technos et tes moyens.

      Dis moi un peu tout ça et j'essayerai de t'aider.

      • Partager sur Facebook
      • Partager sur Twitter

      Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

        15 janvier 2020 à 11:18:56

        Salut,

        J'aimerai un truc qui me renvoi un JSON avec non pas le texte brut de l'image, mais avec les données intéressantes (par exemple pour un rib, je vais vouloir un JSON avec un attribut "IBAN", "CODE GUICHET", "CODE BANQUE" etc... Idem carte d'identité, "NOM", "PRENOM", "DATE DE NAISSANCE" etc...

        Peu importe la technologie, il faut seulement que ca soit compatible avec .NET Framework.

        C'est dans un cadre professionnel, on est donc prêt à payer. 

        Pour l'instant j'ai trouvé deux sociétés de ce type (seulement :/) : 

        -https://www.ocrmobile.com/fr/

        -https://fr.ariadnext.com/

        La première propose un SDK Serveur (ce qui est très intéressant pour nous) mais ne peut supporter que des documents francais.

        La deuxième propose seulement une API (on aimerait ne pas passer par une API) mais supporte des documents de + de 180 pays.

        Voilà où j'en suis.

        Merci de ton aide et de t'intéresser à ma problématique

        • Partager sur Facebook
        • Partager sur Twitter
          15 janvier 2020 à 14:31:33

          Je vois.

          Une société qui fait tout ça je connais que https://www.situve.com/ , mais à mon avis c'est que du FR :/

          Sinon, avec un peu d'effort, il y a Abbyy https://www.abbyy.com/fr-fr/  notamment avec leur produit Flexi-capture https://www.abbyy.com/fr-fr/flexicapture-sdk/  qui est multi language et qui fait tout ça, OCR + LAD, mais il faut développer la pipeline avec des exemples. Et c'est un peu cher.

          Si j'étais vous, j'aurai codé la chose moi même. C'est pas super compliqué. On fait l'OCR via Google vision (intégrable facilement en .NEt depuis VS 2017), et vous codez la logique de récupération de donnée. C'est un peu de boulot, mais sur la longue ça vous reviendra beaucoup moins cher, et surtout, vous serez indépendant sur l'évolution du produit !

          La seule chose à faire c'est trouver un dico qui converti en plusieurs langues les mots clefs ("Nom", "Prénom", etc...)

          Désolé de pas pouvoir aidé plus que ça avec une solution clés en main, j'ai pas trop eu ces contraintes sur mes autres projets et j'ai codé moi même la récupération des informations.

          • Partager sur Facebook
          • Partager sur Twitter

          Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

            15 janvier 2020 à 15:38:49

            Oui situve est la société qui tient le site OCRMOBILE.com

            Abby j'avais l'impression que c'était un OCR basique, auquel on aurait du justement rajouté une surcouche de code. Mais je vais regarder FlexiCapture.

            Coder la chose nous même n'est pas envisageable, nous sommes une PME et on est que 6 devs, on est déjà surchargé, et c'est pas notre  coeur de métier (nous, on fait de l'informatique de gestion).

            Sans parler de prendre en compte les différents formats de RIB en fonction des banques, cartes d'identités en fonction des pays... Je pense que ca représente un gros volume de travail/code, et comme je l'ai dit, on a pas le temps :/

            Notre boite marche très bien donc payer pour un outil efficace ne nous dérange pas.

            Merci déjà de l'orientation vers Abby ;)

            • Partager sur Facebook
            • Partager sur Twitter
              15 janvier 2020 à 16:58:30

              T'aurais une estimation du prix que la boite serait prêt à mettre pour un SDK de ce genre ?

              J'avais déjà pensé à faire ma startup sur ça justement, mais j'ai tellement de projet que j'ai pas pris le temps de mener à bien celui-ci.

              Après si ça existe pas et que la demande / prix est intéressant je pourrais m'y pencher plus sérieusement.

              • Partager sur Facebook
              • Partager sur Twitter

              Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

                15 janvier 2020 à 17:56:55

                Ba si je prends exemple sur les offres existantes (société situvE), on serait prêt à prendre leur offre à 48 000 traitements (on fait pas un volume de pièce non plus faramineux), je pense que la boite serait prêt à mettre 10-20K€/an. Apres c'est pas non plus notre "coeur de métier" cet histoire d'OCR, ca marche sans pour l'instant ^^.

                Dans des business où ce besoin serait plus critique, connaissant vite fait ma direction, ils seraient prêt à mettre beaucoup plus.

                Mais bon, je prends le cas de ma boite qui n'est qu'une parmi tant d'autres (une PME), je sais pas si on peut en tirer une règle générale.

                -
                Edité par earp91 15 janvier 2020 à 18:00:30

                • Partager sur Facebook
                • Partager sur Twitter
                  16 janvier 2020 à 12:30:37

                  Ok je vois. Si plusieurs entreprises sont dans ce cas, ça vaudrait peut-être le coup que je m'y penche dessus.

                  Pour le moment j'ai uniquement fait pour du traitement de facture, mais en vrai les algo sont tellement modulable que je peux récupérer un peu n'importe quelle info sorti d'un OCR sur n'importe quel gabarit (RIB ou facture, même chose par rapport à mes algos).

                  Par contre, pourquoi vous voulez pas passer par une API ? J'avais plutôt dans l'idée d'en faire un web service public dans le cloud pour me faciliter la vie. 

                  -
                  Edité par WorstDevEver 16 janvier 2020 à 12:31:16

                  • Partager sur Facebook
                  • Partager sur Twitter

                  Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

                    16 janvier 2020 à 15:40:04

                    Dans le principe se baser sur une API crée une dépendance externe, et ils aiment pas trop ça.

                    On aime avoir la main sur tout nos processus.

                    • Partager sur Facebook
                    • Partager sur Twitter

                    OCR Rib/CNI/Passeport

                    × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                    × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
                    • Editeur
                    • Markdown