Partage
  • Partager sur Facebook
  • Partager sur Twitter

Analysez vos données textuelles

Syntagmes nominaux

    4 juillet 2019 à 23:03:34

    Bonjour,

    J'ai compris comment fonctionne le Bag of Words et le TF-IDF. J

    e me demandais s'il y avait une méthode spécifique pour extraire les syntagmes nominaux les plus pertinents d'un texte. Je précise que je parle des syntagme nominaux à emboîtement simple qui suivent un pattern max de type determinant+nom+ adjectif +préposition +déterminant + nom + adjectif (ou variante ex. la maison de la forêt noire).

    Merci de vos réponses.

    AC

    • Partager sur Facebook
    • Partager sur Twitter
      5 juillet 2019 à 10:47:33

      Avec NLTK tu peux récupérer facilement la classe grammaticale des mots (adverbe, préposition, etc...) et leurs fonctions.

      A partir de ça tu peux facilement construire toi même une logique de récupération.  (si nom suivit de adjectif alors ...) 

      • Partager sur Facebook
      • Partager sur Twitter

      Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

        8 juillet 2019 à 16:56:05

        Merci de la réponse. J'extrais déjà les syntagmes nominaux avec Spacy. Mon problème est de savoir quels sont les plus pertinents (en terme de poids sémantique). Je me demandais s'il y avait une méthode de pondération pour les syntagmes car si j'ai bien compris, le tf idf concerne uniquement les "mots simples"..

        Est-ce que le fait de baser l'extraction des syntagmes nominaux sur un des termes du syntagme avec un score TF-IDF est pertinent ?

        • Partager sur Facebook
        • Partager sur Twitter
          9 juillet 2019 à 9:01:11

          Je sais que c'est utilisé pour jauger le sentiment (-1 = négatif, 0 = neutre, 1 = positif) ainsi que l'objectivité (-1 = subjectif, 1 = objectif), mais je n'ai jamais vu de cas pour mesurer la pertinence des syntagmes. A mon avis oui ça a un sens, surtout dans le cadre d'un résumé automatique, mais je ne connais pas d'API ou lib qui mesure cela, après c'est pas du tout mon domaine donc je ne suis pas une référence.

          -
          Edité par WorstDevEver 9 juillet 2019 à 9:01:54

          • Partager sur Facebook
          • Partager sur Twitter

          Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

            9 juillet 2019 à 9:54:47

            Ok, merci de ta réponse. Je continue mes recherches....
            • Partager sur Facebook
            • Partager sur Twitter

            Analysez vos données textuelles

            × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
            • Editeur
            • Markdown