Partage
  • Partager sur Facebook
  • Partager sur Twitter

[Machine Learning] Feature extraction

Question de débutant

Sujet résolu
    5 février 2020 à 15:17:43

    Hello  les zéros !

    Je me suis mis au machine learning il n'y a pas longtemps et j'essaie de comprendre le concept d'extraction de feature.

    En gros, j'ai un corpus et je voudrais qualifier les informations qui y figure.

    Par exemple :

    "Bonjour, je m'appelle Brigitte et j'habite Paris. Je suis la femme du président de la république"

    Je veux extraite par exemple la ville de "Paris" et retrouver les coordonnés dans une base de données

    J'ai deux possibilité ( je crois )

    Faire une boucle et tester chaque mots et bloque de mots de la phrase

    Bonjour : Rien
    
    Bonjour je : Rien
    
    Bonjour je m'appelle : Rien
    
    Etc... jusqu'à arriver à 
    
    Paris : .98 [Trouvé !]
    
    Paris Je : .5 ( boff )



    Ou, et je viens d'y penser, sortir un tableau en résultat qui enverra une valeur au dessus de .8 ( par exemple ) quand il trouvera quelque chose

    Bonjour, je m'appelle Brigitte et j'habite Paris. Je suis la femme du président de la république
    
    [0, 0, 0, 0, 0, 0, .98, 0, 0, 0, 0, 0, 0, 0, 0, 0]

    Les phrases auraient donc une taille limite ( ce qui ne m'arrange pas trop, mais j'imagine avec une LSTM, ça passe )

    Vous qui êtes bons en machine learning, j'imagine que vous avez déjà une solution :magicien:

    Merci d'avance :pirate:

    -
    Edité par BlixisKila 5 février 2020 à 15:21:45

    • Partager sur Facebook
    • Partager sur Twitter
      27 août 2020 à 13:54:29

      Hello. juste pour dire que je suis toujours aussi pommé !

      Je suis passé par du LSTM et du Name Entity Recognition avec une couche CRF...

      J'ai toujours eu des résultats assez moyens ( voir médiocre )

      Si quelqu'un peut m'aider, je suis prêt à lui donner un petit cachet :lol:

      • Partager sur Facebook
      • Partager sur Twitter
        7 septembre 2020 à 21:19:33

        bonjour.

        Juste pour dire que j'ai résolu mon problème.

        J'ai fait en sorte d'enlever les mots "important" du premier jeux de donné et en créé un deuxième sans eux et mélangé...

        Du coup, le réseau vois qu'il manque des mots importants et n'active pas la mauvaise porte

        • Partager sur Facebook
        • Partager sur Twitter

        [Machine Learning] Feature extraction

        × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
        • Editeur
        • Markdown