• 2 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 22/01/2024

Analysez des données sur des fichiers avec GPT-4

ChatGPT ne se contente pas de travailler sur du texte ou des images. Il peut aussi travailler sur des documents entiers !

Les fonctionnalités que nous allons voir dans ce chapitre sont assez avancées et particulièrement impressionnantes. Elles font appel à une fonctionnalité appelée "Code interpreter" qui augmente significativement les capacités de ChatGPT : il va générer des programmes qu'il va exécuter lui-même !

Lisez et résumez un PDF

Commencez par envoyer un PDF à ChatGPT, en utilisant la petite icône de pièce jointe à gauche de la zone de texte (comme pour l'envoi d'image).

L'icône d'upload de fichier. Vous pouvez uploader de nombreux types de fichiers.
L'icône d'upload de fichier. Vous pouvez uploader de nombreux types de fichiers.

Si vous n'avez pas d'idée, vous pouvez par exemple vous entraîner en envoyant le rapport de mission d'OpenClassrooms.

Ensuite... demandez-lui ce que vous voulez sur le PDF !

ChatGPT lit le document que vous lui avez envoyé, et répond en fonction des questions que vous lui posez. Des exemples suivent illustration.
ChatGPT lit le document que vous lui avez envoyé

Allez je vous aide avec quelques idées...

Faites un résumé

La fonctionnalité la plus utilisée probablement consiste à demander un résumé du fichier :

🧔🏻‍♂️ : [Fichier] Fais moi un court résumé de ce PDF

🤖 : Le Rapport de Mission 2023 d'OpenClassrooms détaille les efforts continus de l'organisation pour rendre l'éducation accessible à tous. En se concentrant sur l'amélioration de l'évaluation de leur impact, OpenClassrooms a fait des progrès significatifs en partageant les évolutions professionnelles positives de ses étudiants. Une grande partie des étudiants vient de populations sous-représentées, ce qui reflète l'engagement d'OpenClassrooms envers l'inclusion.

[...]

Avoir un résumé en quelques secondes, c'est génial, quel gain de temps ! 😀

Relevez le plan du document

Personnellement, j'aime bien comprendre l'architecture d'un document. Demandons-lui le plan du fichier (titres et sous-titres) :

🧔🏻‍♂️ : [Fichier] Détaille-moi le sommaire de ce document

🤖 : 

Le sommaire du Rapport de Mission 2023 d'OpenClassrooms est divisé en plusieurs sections majeures, détaillant divers aspects de l'organisation et de son impact :

1. **Analyse quantitative**:
- Cours gratuits : Discussion sur l'usage et l'impact des cours gratuits, souvent appelés MOOCs.
- Parcours payants : Analyse des étudiants inscrits dans les parcours de formation payants.
- Évolutions professionnelles : Explication des critères d'OpenClassrooms pour enregistrer une évolution professionnelle.

2. **Analyse qualitative**:
- Qui sont nos étudiants de catégories sous-représentées ? : Définition des groupes ciblés par OpenClassrooms.
- Taux de succès par catégorie : Comparaison des taux d'évolution professionnelle entre différentes catégories d'étudiants.

[...]

Dégagez les principaux chiffres

Besoin d'avoir la matière brute, le pur jus ? Alors soyez créatifs, dites ce que vous voulez extraire. Par exemple, si vous ne voulez que les principaux indicateurs présents dans le document :

🧔🏻‍♂️ : [Fichier] Quels sont les principaux indicateurs présentés et quelles sont leurs valeurs ?

🤖 : 

Le Rapport de Mission 2023 d'OpenClassrooms présente divers indicateurs clés, dont voici les principaux avec leurs valeurs :

### Cours gratuits :
- **Utilisateurs actifs (moyenne mensuelle)** : 287 000.
- **Cours suivis durant l'année** : 2 203 949.
- **Pays avec des utilisateurs gratuits** : 183.
- **Émissions par utilisateur (cours gratuits et payants)** : 0.083 kg CO2 eq.

### Parcours payants :
- **Personnes ayant candidaté à un parcours en 2022** : 37 218.
- **Part de femmes parmi les étudiants** : 31.2%.
- **Personnes admises à un parcours en 2022** : 16 940.
- **Étudiants ayant commencé un parcours en 2022** : 10 915.

[...]

Analysez des données

Allons plus loin que les PDF. Que diriez-vous d'analyser un jeu de données ? 🤓

On peut en effet envoyer à ChatGPT des fichiers dans de nombreux formats comme :

  • CSV

  • XLS

  • XLSX

  • JSON

  • XML

  • ...

ChatGPT va écrire du code (en Python) pour ouvrir le fichier, l'analyser, etc. Vous pouvez lui demander beaucoup de choses !

Pour cet exemple, je vais me baser sur un fichier de données financières d'entreprise fictif fourni par Microsoft. N'hésitez pas à le télécharger aussi si vous voulez tester comme moi.

Demandez une analyse de base

Commencez par demander de faire une analyse de base du fichier. ChatGPT vous donnera les principales informations à connaître :

🧔🏻‍♂️ : [Fichier] Fais une analyse de base de ce fichier 

🤖 : 

Voici une analyse de base du jeu de données "Échantillon Financier" traduite en français :

### Informations Générales :
- Le jeu de données contient 700 entrées et 16 colonnes.
- Les types de données incluent des objets (chaînes de caractères), des flottants, des entiers et des dates.

### Statistiques Descriptives (pour les colonnes numériques) :
- **Unités Vendues :** Elles varient entre 200 et 4492,5 avec une moyenne de 1608,3 unités.
- **Prix de Fabrication :** Ils varient largement de 3 à 260, indiquant une gamme diversifiée de coûts de produits.
- **Prix de Vente :** Varie également de 7 à 350, reflétant une gamme de produits diversifiée.
- **Ventes Brutes :** Elles varient de 1 799 à 1 207 500 avec une moyenne de 182 759.

[...]

Demandez des idées d'analyses possibles

À partir de là, vous pouvez demander à ChatGPT des analyses plus poussées. Vous pouvez poser les questions variées que vous vous posez, comme par exemple :

🧔🏻‍♂️ : [Fichier] Quel segment de marché génère le plus de profits ? Le moins de profits ?

🤖 :

Le segment de marché qui génère le plus de profits est **Government** avec un profit total de 11,388,173.17. D'autre part, le segment qui génère le moins de profits est **Enterprise**, avec un profit total de -614,545.625, indiquant une perte dans ce segment.

N'hésitez pas à jouer avec, car il peut vous faire gagner beaucoup de temps !

Générez des graphiques

ChatGPT peut aussi générer des graphiques. Voyons ce que ça donne...

Demandez des idées de visualisations

Si vous savez ce que vous voulez demander sur le fichier, faites-le.
Mais si vous êtes à court d'inspiration, demandez à ChatGPT quelques idées :

🧔🏻‍♂️ : [Fichier] Donne-moi 10 idées de tendances et visualisations qu'on pourrait faire avec ces données

🤖 :

1. **Ventes au Fil du Temps** : Créez un graphique en ligne pour visualiser comment les ventes ont changé mois après mois et année après année. Cela pourrait aider à identifier les tendances saisonnières ou la croissance/réduction globale de l'entreprise.

2. **Profit par Produit** : Un diagramme à barres montrant le profit total pour chaque produit. Cela mettrait en évidence quels produits sont les plus et les moins rentables et pourrait influencer les stratégies de vente futures ou le développement de produits.

3. **Répartition des Ventes par Pays** : Utilisez un diagramme circulaire ou une carte choroplèthe pour montrer la répartition des ventes dans différents pays. Cela aiderait à comprendre quels marchés sont les plus lucratifs.

[...]

Lancez la création des visualisations

Maintenant que nous avons des idées de visualisation, nous pouvons lui demander de les créer pour nous !

🧔🏻‍♂️ : [Fichier] Effectue les deux premières visualisations proposées

🤖 :

ChatGPT génère les visualisations directement dans le chat !
ChatGPT génère les visualisations directement dans le chat !

ChatGPT peut générer des visualisations variées comme :

  • Courbes

  • Histogramme

  • Diagramme

  • Camembert

  • etc.

Créez des visualisations géospatiales

Vous pouvez faire beaucoup plus encore avec la fonctionnalité "Code interpreter" que je vous ai présentée dans ce chapitre. Par exemple, vous pouvez lui faire générer des visualisations géospatiales, sans même avoir à lui envoyer un fichier :

🧔🏻‍♂️ : Affiche une carte d'Europe avec des marqueurs plus ou moins gros sur chaque pays en fonction de la population du pays que tu connais dans ta dernière mise à jour.

🤖 : J'ai créé une carte de l'Europe avec des marqueurs sur chaque pays sélectionné, la taille des marqueurs étant proportionnelle à la population du pays. Vous pouvez visualiser la carte en cliquant sur le lien suivant : Visualiser la carte de la population européenne.

ChatGPT vous fait alors télécharger un fichier HTML qu'il a généré pour vous. Ouvrez-le et admirez le résultat !

Une carte générée par ChatGPT
Une carte générée par ChatGPT

Compressez des images

ChatGPT peut compresser et même réduire la taille des images à la demande !

Si vous avez un fichier trop gros, envoyez-le lui et dites-lui par exemple que vous le voulez en taille 800px de largeur, en conservant les mêmes proportions, et avec une compression plus importante pour en réduire le poids.

Dans mon cas, je vais juste envoyer le fichier et lui demander d'en optimiser la taille :

🧔🏻‍♂️ : [Image] Compresse cette image pour en optimiser la taille

🤖 :

The dimensions of the image remain the same after optimization, 2048×1536 pixels, but the file should now be smaller in size due to the compression.

You can download the optimized image using the following link:

Optimized image

ChatGPT a compressé l'image envoyée
ChatGPT a compressé l'image envoyée

Mon image est ainsi passée de 3,2 Mo à 730 Ko ! Avec une qualité tout à fait similaire.

En résumé

  • ChatGPT peut non seulement travailler sur du texte et des images mais aussi exécuter des programmes grâce à la fonctionnalité "Code interpreter", accessible avec un abonnement ChatGPT Plus et l'activation de GPT-4.

  • Envoyez un PDF et demandez à ChatGPT de faire des analyses poussées, comme en résumer le contenu, détailler son sommaire, ou extraire les principaux chiffres et indicateurs.

  • Pour les jeux de données dans des formats comme CSV, XLS, JSON, etc., ChatGPT peut effectuer des analyses de base, proposer des analyses plus détaillées, et même générer des graphiques pertinents pour visualiser des tendances.

  • ChatGPT peut aussi générer des cartes interactives et des visualisations géospatiales. 

  • ChatGPT peut également compresser des images pour optimiser leur taille sans perte significative de qualité.

Vous avez jusqu'à présent vu comment ChatGTP arrivait à générer du texte. Voyons, dans le chapitre suivant, comment il peut également générer des images !

Exemple de certificat de réussite
Exemple de certificat de réussite