Tous les cours

Data

Analysez vos données textuelles

Les données textuelles, non structurées, sont omniprésentes dans vos fils d'actualité, ou encore sur les réseaux sociaux. Transformez et modélisez vos données textes grâce aux bag of words, aux word embedding et même aux réseaux de neurones !
DifficultéMoyenne8 heures
Ce cours en libre accès vous intéresse ?

Bienvenue dans ce cours de traitement du langage naturel. L’objectif de ce cours est de comprendre les méthodes qui permettent de transformer le texte en features exploitables par des algorithmes de machine learning, et les architectures et modèles qui correspondent le mieux à ce type de données. En l’occurence un ensemble de documents texte non-structurés.

Ce cours est divisé en 3 parties : une première qui traite de l'exploration, du nettoyage et de la normalisation du texte. Une seconde partie dédiée au différents types de transformations qui vont vous permettre de mieux comprendre vos données textuelles et de créer des features que vous pourrez utiliser dans vos algorithmes de machine learning. La dernière partie sera consacrée à la classification du texte à l'aide de l'apprentissage automatique sous forme de réseau de neurones.

Objectifs pédagogiques

  • Représenter un corpus textuel en bag-of-word
  • Effectuer des plongements de mots
  • Classifier des textes avec une LDA

Contributeurs

Professeur

Yannis Chaouche

Newsletter hebdomadaire pour les data scientists - mlacademy.substack.com

Créé par

OpenClassrooms

Mis à jour le 23/01/2025

Licence

Data

Analysez vos données textuelles

DifficultéMoyenne8 heures
Cours en libre accès