Partage
  • Partager sur Facebook
  • Partager sur Twitter

Toute combinaison de mots possibles

    27 juin 2023 à 19:30:00

    26 est le nombre de lettres dans l'alphabet française si on veut constituer un mot de 1 caractere on a combien de choix on a 26 choix sinon si on veut constituer un mot de deux caractères on a selon le principe fondamental de dénombrement 26×26 choix on connait le mot avec le plus grand nombe de caracteres qui est anticonstitutionnellement qui contient 25 caracteres maintenant si on veut connaitre le nombre de mots de 1 caractère à 25 caractère qu'on peut constituer avec les 26 lettres de l'alphabet donc selon les regles de probabilité on a 26^1+..+26^25 mots possibles .
    Selon Chatgpt , le livre avec le plus grand nombre de mots contient 2 100 000 mots.
    Maintenant on veut connaitre le nombre de livre constitué de 1 mot à 2 100 000 mots toujours avec le principe fondamental de denombrement on obtient (26^1+..+26^25)^1+..+(26^1+..26^25)^2100000 livres possibles un nombre gigantesque et méta-astronomique (le nombre d'atomes dans l'univers est approximativement 10^80 atomes) impossible à imaginer qu'un ordinateur puissant de dernière génération ne peut stocker mais qui représente le nombre exact de tous les livres possibles avec 2100000 mots maximum avec du sens ou non et qui ont existé , existeront ou pas dans l'histoire de l'humanité.

    J'ai pensé à créer un algorithme un programme  qui genere touts les textes possibles je pense que la majorite des textes sera des textes avec du non sens et que dans de rares cas j'aurai des textes avec du sens et vu que le nombre des textes est tres grand jai songe à une intelligence artificielle qui detecte les textes qui ont du sens que pensez vous de ceci 

    • Partager sur Facebook
    • Partager sur Twitter
      27 juin 2023 à 19:52:50

      Est-ce que tu sais s'il existe des intelligences artificielles capables de détecter si un texte a du sens ?

      Il me semble que les récents progrès ont consisté à générer du texte qui l'air naturel. Donc tu devrais être moins ambitieux : générer des tonnes de livre et trouver parmi eux ceux qui ont l'air de vrais textes (quitte à ce qu'ils racontent n'importe quoi, comme ChatGPT parfois).

      Mais fais quelques calculs d'abord. Je ne serais pas étonné que le nombre de livres possibles soit si grand qu'il faille plus de 100^(100^100) milliards d'essais avant de tomber sur un livre qui a l'air vrai.

      • Partager sur Facebook
      • Partager sur Twitter
        28 juin 2023 à 6:55:05

        Remarque:


        + il y a peu de mots d'une lettre, sauf si on compte les mots du genre  d  comme dans  d'une.


          sinon, il y a seulement  a  et y


        + il n'y a pas 676 mots valides de deux lettres.


        + il y a très peu de mots de plus de 20 lettres.


        Ce qui réduit tout de même le nombre de mots possibles même si ça demeure astronomique.


        Avant de passer à une Intelligence Artificielle, on pourrait déjà filtrer les mots qui ne figurent pas dans le dictionnaire "officiel".


        Et ça se fait avec un programme relativement simple.

        • Partager sur Facebook
        • Partager sur Twitter

        Le Tout est souvent plus grand que la somme de ses parties.

          28 juin 2023 à 16:52:21

          def get_english_words():
              with open('C:\\Users\\delll\\Desktop\\text.txt', 'r') as file:
                  word_list = file.read().splitlines()
              return word_list
          
          english_words = get_english_words()
          
          import itertools
          
          def generate_combinations(words):
              # Generate combinations using itertools.product
              for r in range(1, len(words) + 1):
                  for combination in itertools.product(words, repeat=r):
                      yield combination
          
              # Generate combinations using itertools.combinations
              for r in range(2, len(words) + 1):
                  for combination in itertools.combinations(words, r):
                      yield combination
          
          combinations = generate_combinations(english_words)
          list_res = []
          for combination in combinations:
              res = ' '.join(combination)
              list_res.append(res)
          
          
          # result_list = [string for string in original_list if len(string) == 100]
          
          
                  
          
          
          
          
          j'ai trouvé sur le net un fichier texte qui contient tous les mots de la langue anglaise environ 460000 mots ce script combine ces mots et génère une liste très grande de chaines de caractères le probleme c'est que l'ordinateur n'est pas assez puissant pour  faire tous ces calculs il prend du temps j'ai aussi cherche de quoi faire detecter les chaines avec du sens avec chatgpt
          • Partager sur Facebook
          • Partager sur Twitter
            28 juin 2023 à 22:44:22

            Mmh pour se retrouver avec un livre avec plus ou moins de sens il faudrait trouver 1 tableau de donnés référencent et classifiant les mots du dictionnaire, il faut que ce soit classer en fonction de la nature des mots (adverbes, prépositions, conjonctions, noms, verbes, adjectifs, pronoms, déterminants).

            Mais après tout pour faire ce que tu veux je pense que tu peut simplement prendre un tableau de donnés avec des mots en quantité suffisante sur un même thème, toujours classés, au moins ça évite de te retrouver avec un phrase qui comprend des mots qui n'ont strictement rien à voir et en plus tu n'a pas besoins de télécharger un fichier comportant tout les mots du dico (après faut en trouver).

            Ensuite il faut que ton programme fasse ces choses, 

            • Prendre un personnage principale qui aura 2 appellations différentes, ça description, exemple "le chat + un adj random", un PP, exemple "Il"
            • Forcer l'enchainement de Sujet verbe complément, en mettant comme sujet et complément tout les moi classés en tant que nom
            • Ajouter des adverbes de lieux et de temps à chaque débuts de paragraphe
            • Sauter des lignes aléatoirement (entre 5-10 pour les paragraphes)

            Tout cela est faisable facilement avec python ou batch ou tout autre langages de programmations (pas besoins de connaissance trop poussés en plus tu as des IA pour le code (donc une à laquel je me souvient plus du nom). Après ce sera pas avec ce code que tu pourra te faire de l'argent avec des livres... Pour ça faudrais plutôt faire un python qui force chatGPT à faire des textes pour les enregistrer dans des fichiers différents (vérifie d'abord que ce n'ai pas contraire aux conditions d'utilisation).

            • Partager sur Facebook
            • Partager sur Twitter

            Le code est notre langue, la programmation notre passion, la technologie notre avenir!

            Toute combinaison de mots possibles

            × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
            × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
            • Editeur
            • Markdown