Partage
  • Partager sur Facebook
  • Partager sur Twitter

générateur de mots

idée d'exercice communautaire

    3 juillet 2020 à 14:54:32

    bonjour à tous,

    je vous propose de débattre sur un algorithme permettant de générer des mots ressemblant à du français. Cette vidéo donne une idée de départ: https://www.youtube.com/watch?v=YsR7r2378j0

    je pense que l'on pourrait établir la probabilité pour des groupes de 2 lettres mais aussi de 3 lettres pour plus de précision, et pour les syllabes terminales.

    qu'en pensez-vous ?

    • Partager sur Facebook
    • Partager sur Twitter

    Python c'est bon, mangez-en. 

      3 juillet 2020 à 20:20:56

      As-tu essayé de faire des recherches sur le forum?
      Il me semble que quelqu'un a récemment posté sur ce sujet.
      Je ne me souvient cependant pas si c'était en Python ou un autre langage.
      Il ne me semble pas que c'était en cC ni en C++
      Je vais essayer de chercher de mon côté.

      -
      Edité par PierrotLeFou 3 juillet 2020 à 20:22:10

      • Partager sur Facebook
      • Partager sur Twitter

      Le Tout est souvent plus grand que la somme de ses parties.

        3 juillet 2020 à 21:45:01

        Les syllabes terminales, ce sont les syllabes qui vont passer leur bac ?
        • Partager sur Facebook
        • Partager sur Twitter

        typage structurel ftw

          3 juillet 2020 à 21:50:11

          digammaF a écrit:

          Les syllabes terminales, ce sont les syllabes qui vont passer leur bac ?


          Na, j'veux dire le groupe de lettres qui terminent un mot ... ^^
          • Partager sur Facebook
          • Partager sur Twitter

          Python c'est bon, mangez-en. 

            3 juillet 2020 à 22:17:54

            josmiley a écrit:

            je pense que l'on pourrait établir la probabilité pour des groupes de 2 lettres mais aussi de 3 lettres pour plus de précision, et pour les syllabes terminales.

            qu'en pensez-vous ?

            Ce que tu cherches a faire c'est en fait des n-gram de lettres. Ca a très probablement déjà été fait mais si tu veux le faire, il y a plein de datasets avec des livres en français ou les mots du dictionnaire.

            • Partager sur Facebook
            • Partager sur Twitter
              3 juillet 2020 à 22:50:50

              Il y a quelque temps j'ai trouvé une liste de 300 000 mots français (certainement la même que dans la vidéo), je ne sais plus où mais au cas où c'est utile voici : https://ufile.io/l08g1yjd
              • Partager sur Facebook
              • Partager sur Twitter

              typage structurel ftw

                4 juillet 2020 à 1:59:23

                digammaF a écrit:

                Il y a quelque temps j'ai trouvé une liste de 300 000 mots français (certainement la même que dans la vidéo), je ne sais plus où mais au cas où c'est utile voici : https://ufile.io/l08g1yjd

                J'ai un dictionnaire de 323 577 mots (pas un de plus ...( que j'ai téléchargé du site Oc.

                Je pense que ça vient d'un jeu du pendu. Était-ce de Python, de C ou de C++?

                Je n'ai toujours pas trouvé le sujet que j'ai mentionné. Il faisait allusion à la même vidéo.

                Et le sujet n'est pas atteint d'une maladie en phase terminale. :)

                edit:

                J'ai trouvé le sujet, mais on en discute moins:

                https://openclassrooms.com/forum/sujet/erreur-de-memoire-avec-un-gros-dictionnaire

                -
                Edité par PierrotLeFou 4 juillet 2020 à 3:18:36

                • Partager sur Facebook
                • Partager sur Twitter

                Le Tout est souvent plus grand que la somme de ses parties.

                  4 juillet 2020 à 12:33:10

                  entwanne a écrit:

                  Pas envie de regarder la vidéo, c'est des chaînes de Markov ?


                  Markov ? Connais pas ce youtubeur ...
                  • Partager sur Facebook
                  • Partager sur Twitter

                  Python c'est bon, mangez-en. 

                    4 juillet 2020 à 13:06:37

                    Lol c'était de l'humour 😆

                    j'avoue ne pas être sûr de savoir si c'est des chaînes de Markov, mais je suis sûr que c'est des chaînes de caractères.

                    • Partager sur Facebook
                    • Partager sur Twitter

                    Python c'est bon, mangez-en. 

                      4 juillet 2020 à 16:18:16

                      Oui c'est a propos des chaines de Markov ;)
                      • Partager sur Facebook
                      • Partager sur Twitter
                        4 juillet 2020 à 17:15:02

                        josmiley a écrit:

                        Lol c'était de l'humour 😆

                        j'avoue ne pas être sûr de savoir si c'est des chaînes de Markov, mais je suis sûr que c'est des chaînes de caractères.

                        Dans le lien que je mentionne, il est question de chaînes de Markov également.

                        Moi non plus, je ne suis pas particulièrement intime avec Markov. :)

                        • Partager sur Facebook
                        • Partager sur Twitter

                        Le Tout est souvent plus grand que la somme de ses parties.

                          4 juillet 2020 à 17:44:04

                          PierrotLeFou a écrit:

                          digammaF a écrit:

                          Il y a quelque temps j'ai trouvé une liste de 300 000 mots français (certainement la même que dans la vidéo), je ne sais plus où mais au cas où c'est utile voici : https://ufile.io/l08g1yjd

                          J'ai un dictionnaire de 323 577 mots (pas un de plus ...( que j'ai téléchargé du site Oc.

                          Je pense que ça vient d'un jeu du pendu. Était-ce de Python, de C ou de C++?

                          Je n'ai toujours pas trouvé le sujet que j'ai mentionné. Il faisait allusion à la même vidéo.

                          Et le sujet n'est pas atteint d'une maladie en phase terminale. :)

                          edit:

                          J'ai trouvé le sujet, mais on en discute moins:

                          https://openclassrooms.com/forum/sujet/erreur-de-memoire-avec-un-gros-dictionnaire

                          -
                          Edité par PierrotLeFou il y a environ 14 heures

                          Ha ben oui c'est bien la même chose que je comptais faire, je ne suis donc pas seul. Merci d'avoir cherché.

                          • Partager sur Facebook
                          • Partager sur Twitter

                          Python c'est bon, mangez-en. 

                          générateur de mots

                          × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                          × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
                          • Editeur
                          • Markdown