Partage
  • Partager sur Facebook
  • Partager sur Twitter

Analysez vos données textuelles

Syntagmes nominaux

    4 juillet 2019 à 23:03:34

    Bonjour,

    J'ai compris comment fonctionne le Bag of Words et le TF-IDF. J

    e me demandais s'il y avait une méthode spécifique pour extraire les syntagmes nominaux les plus pertinents d'un texte. Je précise que je parle des syntagme nominaux à emboîtement simple qui suivent un pattern max de type determinant+nom+ adjectif +préposition +déterminant + nom + adjectif (ou variante ex. la maison de la forêt noire).

    Merci de vos réponses.

    AC

    • Partager sur Facebook
    • Partager sur Twitter
      5 juillet 2019 à 10:47:33

      Avec NLTK tu peux récupérer facilement la classe grammaticale des mots (adverbe, préposition, etc...) et leurs fonctions.

      A partir de ça tu peux facilement construire toi même une logique de récupération.  (si nom suivit de adjectif alors ...) 

      • Partager sur Facebook
      • Partager sur Twitter

      Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

        8 juillet 2019 à 16:56:05

        Merci de la réponse. J'extrais déjà les syntagmes nominaux avec Spacy. Mon problème est de savoir quels sont les plus pertinents (en terme de poids sémantique). Je me demandais s'il y avait une méthode de pondération pour les syntagmes car si j'ai bien compris, le tf idf concerne uniquement les "mots simples"..

        Est-ce que le fait de baser l'extraction des syntagmes nominaux sur un des termes du syntagme avec un score TF-IDF est pertinent ?

        • Partager sur Facebook
        • Partager sur Twitter
          9 juillet 2019 à 9:01:11

          Je sais que c'est utilisé pour jauger le sentiment (-1 = négatif, 0 = neutre, 1 = positif) ainsi que l'objectivité (-1 = subjectif, 1 = objectif), mais je n'ai jamais vu de cas pour mesurer la pertinence des syntagmes. A mon avis oui ça a un sens, surtout dans le cadre d'un résumé automatique, mais je ne connais pas d'API ou lib qui mesure cela, après c'est pas du tout mon domaine donc je ne suis pas une référence.

          -
          Edité par WorstDevEver 9 juillet 2019 à 9:01:54

          • Partager sur Facebook
          • Partager sur Twitter

          Try->Fail->Learn->Converge to success :{\displaystyle Q[s,a]:=(1-\alpha )Q[s,a]+\alpha (r+\gamma ~max_{a'}Q[s',a'])}

            9 juillet 2019 à 9:54:47

            Ok, merci de ta réponse. Je continue mes recherches....
            • Partager sur Facebook
            • Partager sur Twitter
              15 août 2019 à 9:16:36

              Bonjour,

              Serait-il possible d'avoir le code nécessaire pour obtenir la "Première visualisation t-sne de notre corpus" s'il vous plaît ? Merci d'avance

              -
              Edité par Jofo777 15 août 2019 à 9:17:11

              • Partager sur Facebook
              • Partager sur Twitter
                24 septembre 2020 à 11:48:57

                Bonjour, je reprends la question de Jofo777

                Serait-il possible d'avoir le code nécessaire pour obtenir la "Première visualisation t-sne de notre corpus" s'il vous plaît ?

                • Partager sur Facebook
                • Partager sur Twitter
                  30 mars 2021 à 19:06:36

                  Pour les besoins du cours, quels sont les jeux de données par défaut qu'on peut utiliser sur la librairie nltk
                  • Partager sur Facebook
                  • Partager sur Twitter

                  seyeAda

                    9 avril 2021 à 16:45:40

                    Bonjour, je pense que ce cours n'a pas été relu. On ne peut pas utiliser les mêmes données que le prof, les codes sont incomplets ou source d'erreur, on ne peut pas vraiment suivre, on ne peut pas tester les librairies. Il faudrait le mettre à jour..
                    • Partager sur Facebook
                    • Partager sur Twitter
                      9 avril 2021 à 17:18:04

                      Bonjour,

                      Hello @OC

                      Afin de vous assurer d'avoir une réponse le plus rapidement possible, je vous invite à directement contacter l'équipe du site via l'adresse hello@openclassrooms.com. En effet, l'équipe du site ne passant que très rarement sur les forums, il sera beaucoup plus efficace de les contacter directement.

                      • Partager sur Facebook
                      • Partager sur Twitter
                      Seul on va plus vite, ensemble on va plus loin ... A maîtriser : Conception BDD, MySQL, PHP/MySQL

                      Analysez vos données textuelles

                      × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                      × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
                      • Editeur
                      • Markdown