Nettoyage des données avec Python

Utilisez Python ou R pour organiser des données et faire cohabiter plusieurs jeux de données.

À votre rythme
~ 3 mois

Mentor
individuel

Certification OpenClassrooms

1 projet professionnalisant

La formation Nettoyage des données avec R ou Python vise l’acquisition du Bloc de compétences n°03 de la certification professionnelle Data Analyst : Nettoyer et décrire un jeu de données à l’aide d’un langage de programmation spécialisé afin d’en préparer l’exploitation.

Grâce à ce programme BOOST, vous serez capable de :

  • Classifier différents types de données ;
  • Gérer les erreurs et les incohérences présentes sur des données stockées ;
  • Réaliser une analyse univariée pour interpréter des données.

Prérequis

Pour débuter ce programme, vous devez remplir les conditions suivantes :

  • Niveau de langue : pour les apprenants étrangers, un niveau de français C1-C2 est conseillé pour la réussite de la formation.
  • Matériel : accès à un ordinateur (PC ou Mac), muni d’un microphone, une webcam et une bonne connexion internet (3.2 Mbps en envoi et 1.8 Mbps en réception de données). Pour tester la qualité de votre connexion, cliquez sur ce lien
  • Prérequis académiques :
    Pour accéder directement à la certification, les candidats doivent obligatoirement justifier d'un des pré-requis suivants :

    • être titulaire d’une certification professionnelle de niveau 5 (bac+2 ou équivalent) en commerce, économie, finance, gestion, marketing, informatique ou sciences ;

    ou

    • être titulaire du baccalauréat ou d’une certification professionnelle de niveau 4 (ou équivalent) avec une expérience professionnelle d’au moins 2 ans en commerce, économie, finance, gestion, vente, informatique ou sciences.


    Tout autre profil fera l'objet d'une procédure dérogatoire, incluant un test de positionnement, à savoir :

    • être titulaire d'une certification professionnelle de niveau 5 (bac+2 ou équivalent) tous domaines avec une expérience professionnelle tous secteurs d'au moins 1 an ;

    ou

    • être titulaire du baccalauréat ou d'une certification professionnelle de niveau 4 (ou équivalent) tous domaines avec une expérience professionnelle tous secteurs d'au moins 3 ans ;

    et

Compétences recommandées

Pour réaliser ce programme BOOST dans les meilleures conditions, nous vous conseillons d’avoir déjà acquis les compétences suivantes :

  • Mettre en place un environnement de travail en Python ;
  • Maîtriser les opérations fondamentales du langage Python pour la Data Science ;
  • Manipuler des données avec des librairies Python spécialisées ;
  • Générer un graphique ;
  • Utiliser un notebook.

Vous pouvez acquérir ces compétences en suivant le programme BOOST "Prendre en main Python pour l’analyse de données".

 

Certification OpenClassrooms

OpenClassrooms est un établissement privé d’enseignement à distance déclaré au rectorat de l’Académie de Paris.

À l’issue de votre formation, sous réserve de validation de vos compétences, vous obtiendrez le certificat d’établissement OpenClassrooms « Nettoyage des données avec Python ».

Les projets et compétences en détail

projet 1

Optimisez la gestion des données d'une boutique avec R ou Python

Les données de cette entreprise sont mal organisées. Faites cohabiter les différents jeux de données pour effectuer l'analyse demandée.
80 heures supervisées
Compétences acquises dans ce projet
  • Réaliser une analyse univariée pour interpréter des données
  • Classifier différents types de données
  • Gérer les erreurs et les incohérences présentes sur des données stockées