• 2 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 09/07/2024

Au-delà de ChatGPT : les générateurs de textes, images, vidéos...

Nous avons parlé essentiellement de ChatGPT dans ce cours, car c'est l'outil d'IA le plus célèbre en ce moment. Il a popularisé l'IA auprès du grand public après avoir surpris tout le monde (y compris les chercheurs en IA !).

L'objectif de ce chapitre est de vous donner un petit aperçu de cette "révolution de l'IA en cours", en particulier celle des "IA génératives", comme ChatGPT qui génère du texte. Nous parlerons notamment :

  1. Des autres IA génératives de texte ;

  2. Des IA génératives d'images ;

  3. Des IA génératives d'audio, de vidéos, de slides, de sites web…

Vous n'avez pas fini d'être impressionné ! 😳

Explorez d'autres IA génératives de texte

Si ChatGPT est célèbre, vous devriez néanmoins connaître d'autres IA concurrentes dont le rôle est identique. Certaines d'entre elles atteignent rapidement des niveaux de qualité proches ou comparables à ChatGPT :

  • Bing AI : le moteur de recherche Bing de Microsoft permet de discuter avec une IA qui est exactement celle qui fait tourner ChatGPT. La raison est simple : Microsoft a acheté des parts dans la société OpenAI qui édite ChatGPT, ils se permettent donc de le réutiliser pour leurs propres produits. Attention, l'accès à cette IA reste un peu limitée et nécessite l'usage du navigateur Microsoft Edge.

Capture d'écran de l'interface Microsoft Bing AI
Microsoft Bing AI peut faire des recherches web et les réutiliser dans ses réponses
  • Google Bard : il s'agit d'une IA similaire à ChatGPT, mais gérée par Google. De l'avis général, celle-ci est de moins bonne qualité que ChatGPT, mais elle pourrait néanmoins évoluer rapidement.
    Le paradoxe est que Google est à la pointe de la recherche en IA depuis des années. Ils ont notamment inventé l'algorithme Transformer (le "T" de GPT) qui a été rendu public et réutilisé par d'autres entreprises concurrentes et la communauté open source.

  • Meta LLaMa : c'est l'intelligence artificielle de Meta, l'entreprise derrière Facebook. Une partie de cette IA est open source à la base, mais suite à une fuite de données, celle-ci s'est retrouvée diffusée dans le domaine public dans son entièreté. Cela a permis la création de très nombreux projets d'IA open source et communautaires. Une des forces de LLaMa est qu'on peut l'utiliser sans avoir besoin de payer de nombreux serveurs (certains arrivent à faire tourner l'IA sur un ordinateur maison, ce qui était impensable il y a encore quelques mois où il fallait toute une ferme de serveurs !).

  • Mistral : une IA Open Source très puissante développé par une start-up française (cocorico ! 🐔).

Comme vous le voyez, ces IA sont en apparence le fait des GAFAM (acronyme des géants du Web : Google, Apple, Facebook, Amazon et Microsoft). À l'exception notable de Mistral. On pourrait s'inquiéter qu'elles soient entre les mains de quelques très grosses entreprises… Néanmoins, ce serait ignorer qu'une révolution de l'IA est aussi en cours dans le monde de l'Open Source.

Le monde de l'Open Source évolue très vite et certaines de ces IA peuvent fonctionner sur des ordinateurs portables, voire même sur des téléphones, sans avoir à faire appel à des fermes de serveurs situées dans des data centers.

Découvrez des IA génératives d'images

Au-delà des IA qui génèrent du texte, le même principe peut être utilisé pour générer des images. Le résultat, forcément plus visuel a impressionné même le plus blasé des observateurs. 😳

Les images produites par l'IA sont de qualité professionnelles : il peut s'agir d'images d'art de type peintures, mais aussi d'images 3D ou encore de photographies réalistes. Au point qu'il devient très difficile de savoir désormais si une image est réelle (pour ne pas dire impossible). Prenez l'exemple de cette image virale du Pape en doudoune de luxe :

Une (fausse) image du pape en doudoune de luxe
Une (fausse) image du pape en doudoune de luxe

Elle a été générée par une IA et n'a jamais eu lieu. Elle semble pourtant si réaliste !

Sur la base d'une simple commande texte, comme "Un astronaute sur un cheval se balade dans l'espace" ou "Le Pape portant une doudoune", ces IA peuvent générer des images de grande qualité.

En l'espace de quelques mois, là encore, les images sont passées de "peu impressionnantes" à "très impressionnantes". Regardez la différence de qualité pour une image générée à 1 an d'écart par l'IA Midjourney à partir de la description "Les chemins qui me ramènent à la maison" :

La même image générée à 1 an d'écart par l'IA Midjourney
La même image générée à 1 an d'écart par l'IA Midjourney

Les progrès sont pour le moins impressionnants pour seulement 1 an d'écart (Qu'y aura-t-il dans 1 an, 5 ans ? 🧐).

Voici quelques IA génératives à connaître dans le domaine de l'image :

  • Midjourney : une IA capable de générer des images de grande qualité sur la base d'une simple commande texte. Un usage gratuit est disponible. A la base il faut utiliser un serveur de chat Discord pour pouvoir l'utiliser, ce qui n'est pas très intuitif pour qui n'a pas l'habitude (mais ce n'est pas hors de portée non plus). Heureusement, une version web commence à être disponible, plus intuitive.

  • DALL·E : l'IA génératrice d'images d'OpenAI, les créateurs de ChatGPT. Elle est désormais intégrée à ChatGPT via ChatGPT Plus (et Team et Enterprise).

  • Stability.ai : une IA open source (ce qui la distingue des précédentes). Il est donc possible d'en récupérer le code source et de l'améliorer. Ce que certaines personnes font tous azimuts en partageant leurs "modèles", c'est-à-dire des configurations pour lui permettre de générer des images d'un certain type.
    Pour l'essayer en ligne, utilisez leur service Dreamstudio.

Pour la petite histoire, sachez que l'image qui se trouve en fond de mes vidéos a été générée par Midjourney :

Background virtuel représentant un lieu de vie architectural futuriste, dans les tons rosés et gris. Il n'y a pas de frontière réelle entre l'intérieur et l'extérieur de la pièce.
Le fond d'écran des vidéos de ce cours

Découvrez des IA génératives d'audio, vidéo, slides, sites web…

En fait, les IA peuvent générer maintenant tous types de documents. Certaines sont parfois encore peu surprenantes, mais il est possible qu'en quelques mois elles se révèlent de grande qualité et qu'elles vivent leur "moment ChatGPT" elles aussi.

Il est donc en théorie possible de générer :

  • De l'audio : il est possible de générer de la voix humaine de bonne qualité avec des outils comme ElevenLabs (sur la base d'un simple texte, l'IA peut générer une voix crédible). Il est possible de générer de la musique avec OpenAI Jukebox. Certaines personnes ont réussi à produire des chansons crédibles qui sont devenues virales, comme cette collaboration entre les artistes Drake et The Weeknd (qui n'a jamais eu lieu, mais ça n'a pas empêché de nombreuses personnes d'apprécier la musique). Cela pose d'évidentes questions pour l'avenir par rapport aux droits d'auteur.

  • De la vidéo : encore sommaires, les vidéos deviennent meilleures avec le temps. Si vous voulez en savoir plus, regardez du côté de RunwaySynthesiaD-ID, etc. Il n'est pas interdit d'imaginer des vidéos photoréalistes avec vos artistes préférés générées à la demande à l'avenir (si on exclut la question essentielle des droits d'auteur !). Comme Netflix… mais où chaque série et chaque film seraient créés pour vous à la demande, en fonction de votre humeur du moment.

  • Des slides : combien de temps les professionnels passent-ils à concevoir des slides ? Leur mise en forme peut être longue et fastidieuse. L'IA peut générer des slides sur une simple commande, y compris faire les recherches nécessaires pour savoir quoi dire (ce qui va plus loin que de la simple mise en forme). Ces IA pourraient être très vite intégrées à Powerpoint et Google Slides, mais des services en ligne tels que GammaTome et Beautiful.ai vous donnent une idée du temps qu'il est possible de gagner avec l'IA. Microsoft lui-même commence à intégrer un générateur de slides directement dans Powerpoint !

  • Des sites web : bien que cela soit encore sommaire, il est possible de générer des sites web avec l'aide de l'IA (bien souvent juste la page d'accueil). Vous pouvez essayer Mixo, par exemple, pour vous faire une idée des possibilités.

Vous avez la tête qui tourne ? Moi aussi ! 😵

Prenez un grand bol d'air, sortez et revenez une fois que vous aurez fait une pause. Ensuite, essayez quelques-unes de ces IA : vous aurez l'impression de goûter au futur… sauf qu'il est déjà là. 🚀

En résumé

  • ChatGPT n'est que la partie émergée de l'iceberg de la révolution de l'IA, avec de nombreuses autres IA génératives en cours de développement.

  • Il existe d'autres IA génératives de texte telles que Bing AI, Google Bard, Mistral et Meta LLaMa, avec des forces et faiblesses variées. LLaMa en particulier a donné naissance à de nombreuses IA open source, comme Alpaca et Vicuna.

  • Les IA génératives d'images peuvent créer des images créatives ou réalistes de qualité professionnelle, comme Midjourney, Dall-E et Stability.ai.

  • Les IA peuvent également générer de l'audio, de la vidéo, des slides et des sites web, posant des questions sur l'avenir des droits d'auteur et la création de contenu, mais ouvrant aussi des perspectives incroyables en termes de productivité.

Félicitations ! Vous avez terminé cette partie. Je vous invite à tester vos connaissances dans le quiz qui suit et à me rejoindre dans la partie suivante où nous verrons comment utiliser ChatGPT en fonction de votre métier. 

Et si vous obteniez un diplôme OpenClassrooms ?
  • Formations jusqu’à 100 % financées
  • Date de début flexible
  • Projets professionnalisants
  • Mentorat individuel
Trouvez la formation et le financement faits pour vous
Exemple de certificat de réussite
Exemple de certificat de réussite