• 6 heures
  • Facile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 26/10/2023

Initiez-vous aux fondamentaux du Machine Learning ou de l'apprentissage automatique

Le Machine Learning est une sous-discipline de l'IA
Le Machine Learning est une sous-discipline de l'IA

L’apprentissage automatique nous permet de construire des systèmes informatiques qui apprennent tout seuls à partir des données qu’ils utilisent. Encore mieux : ils sont capables d’améliorer leur performance au cours du temps, en s’enrichissant de nouvelles données.

Ça a l’air fascinant et même un peu magique, présenté comme ça ; décryptons cela ensemble !

Découvrez le principe du modèle 

Une fois que le problème est défini, le programme d’apprentissage automatique va avoir besoin d’un modèle sur lequel s’appuyer.

Pour mieux comprendre, prenons un problème que pourrait rencontrer un agent immobilier : faire estimer un bien au prix de vente le plus conforme au marché immobilier. Pour réaliser cette évaluation, notre professionnel de l’immobilier va effectuer deux étapes :

  1. il recueille des données sur les caractéristiques clés du bien immobilier (par exemple : l’emplacement géographique, la superficie, l’état général, etc.) ; 

  2. il procède ensuite à une évaluation fondée sur des données publiques disponibles, ainsi que sur sa propre expertise immobilière. 

Au fil du temps, il va pouvoir développer sa connaissance du marché qu’il cible. Ainsi, l’agent, fort de toutes ses connaissances immobilières et des données disponibles, va devenir de plus en plus apte à fournir une évaluation de bien. On pourrait dire qu’il a développé un modèle d’évaluation des prix.

Réfléchissez à toutes ces compétences que vous avez développées et pour lesquelles vous avez acquis votre propre compréhension. Vous êtes peut-être un excellent pâtissier, un as du poker ou un pro du basket ? On peut considérer que vous avez construit votre propre modèle dans le domaine en question. Que ce soit sur les proportions de sucre et de farine, les stratégies de cartes ou les tirs en suspension, vous avez affiné vos compétences pour devenir particulièrement bon dans votre domaine. Il s’agit d’une représentation de votre expertise qui vous est propre.

Mais revenons à notre agent immobilier : grâce à son modèle, il pourrait construire son propre logiciel d’estimation de prix. Il devrait pour cela faire le point sur toutes les règles de calcul qu’il utilise dans son métier. Elles sont très nombreuses et parfois pas complètement explicites. À l’issue de ce travail, l’agent aurait suffisamment de documentation pour construire son propre logiciel d’estimation de prix.

Quel est le problème alors ? Cette méthode permet difficilement de résoudre des problèmes très complexes. Si on reprend notre exemple, la connaissance de notre agent immobilier est généralement limitée au quartier dans lequel il intervient.

Mais comment faire quand on cherche à étudier l’estimation immobilière de toute une ville ou de tout un pays ?

Bonne question ! Et oui, on ne peut pas demander à tous les agents immobiliers de se retrouver pour former un modèle basé sur toutes leurs expériences individuelles.

C’est ainsi que l’apprentissage automatique est apparu comme une opportunité majeure ! Il s’agit dorénavant de créer un programme capable de collecter toutes les données disponibles pour un problème donné, et d’apprendre lui-même à partir de ces données pour construire son propre modèle.

Découvrons justement comment les programmes d’apprentissage automatique peuvent apprendre !

Découvrez les différentes manières d’apprendre d’un programme 

Dans apprentissage automatique, le terme "apprentissage" peut poser question.

Qu’est-ce que cela signifie, pour un algorithme, d’apprendre ?

Ce qu’on appelle l’apprentissage (ou entraînement), c’est l’étape qui nous permet de construire notre modèle. Nous fournissons à l’algorithme de nombreux exemples à analyser pour qu’il puisse apprendre par l’expérience. Et il a plusieurs manières d’utiliser ces exemples pour apprendre ; regardons cela en détail ! 

Méthode 1 : l’apprentissage supervisé

Le premier type d’apprentissage est l’apprentissage supervisé.

Nous souhaitons par exemple que l’algorithme apprenne à estimer le prix d’une maison. Nous allons lui fournir de nombreux exemples de ventes de maisons, en lui donnant les caractéristiques de chaque maison ainsi que son prix de vente.

Pour chaque exemple, nous avons donc :

  • les caractéristiques : c’est selon ces caractéristiques que nous souhaitons estimer le prix de n’importe quelle maison, une fois le système entraîné.

C’est par exemple la surface, le nombre de chambres, la présence d’un balcon, etc. ;

  • les étiquettes : c’est la cible que nous souhaitons prédire. Lors de l’entraînement, l’algorithme a accès à cette information. Mais une fois le système prêt, l’objectif est bien entendu de le prédire à partir des caractéristiques d’une nouvelle maison.

Ici, ce sera le prix de la maison.

Au départ, lorsque l’algorithme considère les premiers exemples, il produira des réponses qui ne seront a priori pas très pertinentes. Puis, au fur et à mesure qu’il intégrera de nouveaux cas dans sa phase d’apprentissage, il s'adaptera, se transformera, jusqu’à devenir prêt à estimer le prix de maisons qu’il n’a jamais observées. 

Méthode 2 : l’apprentissage non supervisé 

Dans l'apprentissage supervisé vu précédemment, l'algorithme a accès à l’étiquette, donc à ce que l’on souhaite prédire (dans notre exemple, le prix).

Parfois, nous souhaitons demander à l’algorithme de construire un modèle sans lui fournir d’étiquettes. C’est là qu’est utilisé l’apprentissage non supervisé. Ici, pas d’étiquettes : on ne sait pas à l’avance ce que l’on va trouver.

Par exemple, nous pourrions lui fournir une liste de maisons. Puis, lui demander de faire 3 groupes de maisons, sans aucune supervision de notre part.

Une fois les trois groupes formalisés, il est nécessaire que des experts trouvent le nom des étiquettes, car si les groupes sont formés, ils ne sont pas nommés par l'algorithme.

Par exemple, on pourrait aboutir aux 3 types de zones géographiques : les zones résidentielles, étudiantes ou commerciales. Ainsi, un agent pourra projeter sa bonne connaissance d’un quartier vers une autre zone pour laquelle il n'y a pas d'experts, mais qui lui est similaire.

Méthode 3 : l’apprentissage par essai/erreur

En apprentissage par essai/erreur, aussi appelé apprentissage par renforcement, on parle d'un "agent" (l'algorithme) qui interagit avec un "environnement" (l'ensemble des "caractéristiques"). Les données d'apprentissage de l’algorithme viennent alors directement de l'environnement. Son objectif est de trouver par tâtonnements successifs (essai ou erreur) la solution optimale à un problème donné. On dit que cet algorithme est auto-adaptatif : il est en apprentissage constant. 

Prenons un exemple d’application dans l’architecture. L’idée est de confier à un algorithme la conception du plan d’un immeuble. Pour ce faire, on lui précise toutes les contraintes à prendre en compte, ainsi que les objectifs à optimiser. Par exemple : on souhaite avoir 3 salles de réunion, chacune d’une certaine dimension, avec un certain nombre de fenêtres, et idéalement à proximité les unes des autres. On va ici définir tous les paramètres nécessaires et les contraintes. Ensuite, l’algorithme va chercher le plan idéal par tâtonnements.

Découvrez la phase de prédiction

Pendant la phase d'apprentissage, le programme utilise des données existantes, déjà connues. Une fois qu'il a appris et qu'il est bien entraîné (en utilisant l'une des trois méthodes), il peut dès lors être utilisé pour de la prédiction

  1. Méthode supervisée : en rentrant de nouvelles caractéristiques, l’algorithme va pouvoir nous estimer le prix d’un bien. 

  2. Méthode non supervisée : on peut identifier une nouvelle zone géographique, on regarde à quelle zone connue elle ressemble et on lui applique les mêmes règles. 

  3. En essai/erreur : l'algorithme ne prédit pas, il réessaye. 

En résumé

  • Un modèle est une représentation mathématique qui permet de modéliser des règles par rapport aux données. 

  • La modélisation des données se compose de deux phases : l'apprentissage et la prédiction. 

  • Il existe trois façons d'apprendre pour un programme d'IA : l'apprentissage supervisé, non supervisé et essai/erreur. 

Aujourd’hui, un sous-domaine de l’apprentissage automatique, appelé apprentissage profond, ou Deep Learning, fait beaucoup parler de lui. Il permet d’accomplir des résultats remarquables dans des domaines comme la reconnaissance d’images. Voyons cela plus en détail dans le chapitre suivant.

Exemple de certificat de réussite
Exemple de certificat de réussite