• 15 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 18/02/2020

Installez R ou Python

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Ce dont vous aurez besoin

Pour ce cours, vous aurez besoin d'utiliser soit Python soit R.

Si vous avez déjà installé R dans le passé, alors vous n'avez rien à faire, sauf si vous souhaitez travailler avec un notebook.

Si vous avez déjà installé Python, alors vous aurez besoin des librairies suivantes :

  1. Pandas

  2. Matplotlib

  3. Numpy

  4. Scipy

Si cependant vous n'avez jamais installé Python, alors il existe une solution miracle, qui installera directement Python, toutes les librairies nécessaires, ainsi que le notebook Jupyter

Comment s'orienter dans ce vaste chapitre ?

Tout d'abord, faites votre choix entre Python ou R grâce à la section R ou Python: lequel choisir ?

Ensuite, choisissez si vous souhaitez utiliser un notebook grâce à la section Notebook or not Notebook ?

Une fois ces 2 choix faits, orientez-vous vers l'une de ces 4 sections :

Si vous rencontrez une erreur d'installation, rendez-vous à la section Erreurs fréquentes.

R ou Python: lequel choisir ?

R et Python sont les deux langages les plus réputés pour l'analyse et le traitement des données. Maîtriser l'un de ces langages, c'est s'armer d'une compétence indispensable dans le domaine de la data science. En plus, ces deux langages se développent depuis de nombreuses années... Ils sont donc fiables et soutenus par de vastes communautés d'utilisateurs prêts à vous aider !

Si vous souhaitez faire un choix informé, nous vous conseillons de consulter ces ressources (en anglais) :

Pour faire court, disons que R est le plus utilisé parmi les Data Analysts et Python parmi les Data Scientists. R est un langage très spécifique aux statistiques et y est vraiment très adapté, alors que Python est très généraliste : il permet également de créer des applications, des sites webs, etc. Python est plus agréable à utiliser (en terme de simplicité et de lisibilité du code), mais il n'est pas directement fourni avec les librairies utilisées en Data Science : il faut les installer. L'avantage avec R, c'est que vous pouvez directement manipuler vos données via la structure du dataframe, qui est native du langage. 

Notebook or not Notebook ?

Sans notebook, vous devrez écrire votre programme R ou Python dans un fichier, l'enregistrer, puis le lancer à l'aide de la console avec la ligne de commande  python monfichier.py  ou  Rscript monfichier.R.

Cependant, travailler de cette manière sera fastidieux. En effet, si votre programme affiche des graphiques (ce que nous ferons beaucoup dans ce cours !), ils s'afficheront soit tous en même temps dans des fenêtres séparées, soit ils s'afficheront les uns après les autres au fur et à mesure que vous fermez les fenêtres graphiques. De plus, il sera difficile de revenir en arrière dans votre programme sans tout relancer depuis le début.

Un notebook est la solution idéale. Déjà, il est plus convivial car vous tapez votre code directement dans un navigateur web (type Firefox, Chrome, Safari, Spartan, feu Internet Explorer, etc.). Vous pourrez facilement revenir en arrière en exécutant les lignes de code que vous souhaitez. Enfin, les graphiques s'affichent dans le navigateur, et c'est bien plus pratique ! Vous pouvez essayer le notebook Jupyter ici, ou avoir un aperçu de son utilisation dans la vidéo de ce cours.

Installer R sans notebook

R est disponible sous différentes plateformes : Windows, Mac OS et Linux.

Rendez vous sur la page de téléchargement de R (page en anglais) pour sélectionner un des miroirs de téléchargement.

Installation sous Windows

Une fois votre miroir choisi, cliquez sur le lien Download R for Windows puis sur le lien base. En haut de page apparaît alors un lien Download R x.x.x for Windows (où x.x.x représente le numéro de version), cliquez dessus pour le télécharger.
Une fois le téléchargement fini, lancez le programme d'installation et suivez les instructions données par les différentes boîtes de dialogue vous permettant, par exemple, de choisir la langue du protocole d'installation ou le dossier dans lequel sera installé R.
Il vous est alors demandé de choisir le type d'installation. L'installation complète ne demande qu'une soixantaine de Mo d'espace, il est donc conseillé de la sélectionner comme illustré ci dessous.

(Pour l'installation complète, assurez-vous d'avoir sélectionné Installation utilisateur complète).

Si vous disposez de très peu d'espace sur votre machine, vous pouvez vous contenter de l'option par défaut. L'installation minimale est quant à elle peu recommandée dans la mesure où elle n'installe pas certains fichiers d'aide. Enfin, si vous pensez comprendre tous les éléments indiqués dans la liste, vous pouvez essayer d'effectuer une installation personnalisée mais cette fonctionnalité est plutôt réservée aux utilisateurs avancés.

Une fois cette étape réalisée, continuer à suivre les indications des boîtes de dialogue en gardant les options par défaut. Après quelques clics, vous aurez installé R, félicitations. ;)

Testez maintenant si cela a fonctionné, en continuant à la section Testez R.

Installation sous Ubuntu

Sous Ubuntu ou autre distribution dérivée de Debian, vous pouvez trouver R via apt-get ou synaptic. Le paquet s'appelle r-base et vous pouvez donc l'installer en lançant la ligne de commande suivante :

sudo apt-get install r-base

Si vous disposez d'un autre type de distribution ou que vous souhaitez compiler directement les sources, choisissez le lien Linux sur la page de téléchargement du miroir que vous aurez choisi et sélectionnez le dossier correspondant à votre distribution pour télécharger les sources. Les instructions d'installation se trouvent alors dans un fichier d'aide présent dans le dossier téléchargé.

Testez maintenant si cela a fonctionné, en continuant à la section Testez R. Si ce n'est pas le cas, rendez-vous sur cette page, sélectionnez votre distribution Linux, puis consultez le fichier README correspondant.

Installation sous une autre distribution Linux

Rendez-vous sur cette page, sélectionnez votre distribution Linux, puis consultez le fichier README correspondant. Ensuite, testez R.

Installation sous Mac OS X

Une fois le miroir choisi, cliquez sur Download R for (Mac) OS X , puis dans la section Files, cliquez sur le premier lien proposé (du type R-x.xx.x.pkg où x.xx.x représente le numéro de version).
Lancez alors le fichier téléchargé en prenant soin de vérifier que votre compte dispose des droits nécessaires. Suivez les instructions données par les boîtes de dialogue. Vous n'aurez normalement pas à changer d'option et pouvez donc valider chaque étape.
Votre mot de passe vous sera normalement demandé lors de l'installation.
Après quelques secondes ou minutes d'attente, R sera installé.

Testez maintenant si cela a fonctionné, en continuant à la section Testez R.

(Merci à Philippe Julien pour la rédaction de cette partie)

Testez R

Pour tester R, ouvrez une console (si vous ne savez pas comment faire, c'est par ici), et tapez-y tout simplement :

R

... puis validez grâce à la touche Enter de votre clavier. Il devrait normalement s'afficher quelque chose qui ressemble vaguement à cela :

Si c'est le cas, c'est que vous êtes en train d'interagir avec R ! Tapez maintenant ceci :

3 + 2

Validez grâce à la touche Entrer. Si R vous répond  5, c'est que tout est bon ! :D

Pour quitter R, il faut taper  q(), ou utiliser le raccourci clavier Ctrl + D. Il faudra alors répondre à la question "Save workspace image?", ce à quoi vous pouvez répondre "y" pour oui, ou "n" pour non, en fonction de si vous souhaitez sauvegarder votre travail (c'est-à-dire toutes les variables que vous avez définies au cours de votre session de travail).

Testez R avec un fichier de script

A ce stade, vous devez choisir si vous souhaitez utiliser R avec un notebook ou pas. Si ce n'est pas le cas, il vous faudra écrire votre programme dans un fichier. Mais dans tous les cas, il est indispensable de savoir comment faire :

  • Créez un fichier et nommez-le  monscript.R.

  • Ouvrez ce fichier avec un éditeur de texte, écrivez-y print(3+2), puis sauvegardez le fichier.

  • Ouvrez une console et placez-vous dans le répertoire (le dossier) dans lequel vous venez de créer votre fichier.

  • Dans la console, saisissez la commande suivante :

Rscript monscript.R

Normalement, il devrait s'afficher le résultat du calcul 3+2 :

[1] 5

Installer R avec notebook

Il vous faudra tout d'abord... installer R sans notebook, allez hop hop hop, on remonte de quelques lignes !

Ensuite, il vous faudra installer Jupyter (le comble, c'est que Jupyter est codé en Python, alors il vous faudra aussi installer Python !). Pour installer Jupyter, rendez-vous à la section Installer Python avec notebook.

Ensuite, rendez-vous sur cette page : https://irkernel.github.io/installation/, et suivez les instructions. Il s'agit de lignes de code à taper dans R.

Pour vérifier si cela a fonctionné, lancez Jupyter. Une fois sur la page d'accueil de Jupyter (à laquelle vous pouvez accéder depuis un navigateur en saisissant l'url http://localhost:8888/tree), en haut à droite, il y a un bouton "New" : si vous cliquez dessus, une option "R" devrait vous être proposée. Si vous cliquez dessus, un nouveau notebook R sera créé :

Tester le notebook Jupyter avec R
Tester le notebook Jupyter avec R

Installer la totale : Python + librairies + notebook (distribution Anaconda)

Si vous n'avez jamais installé Python, alors autant installer la distribution Anaconda.

En gros, une distribution, c'est un langage de programmation + certaines librairies et autres fonctionnalités.

Anaconda est donc une distribution Python, faite pour la Data Science.

Il installera donc :

  • Python

  • les librairies de Data Science dont nous aurons besoin : Matplotlib, Scipy, Numpy, Pandas

  • le notebook Jupyter, que je vous conseille vivement d'utiliser

Pour télécharger la distribution Anaconda, c'est par ici : https://www.anaconda.com/download/

Les instructions d'installation se trouvent sur cette page : https://docs.anaconda.com/anaconda/install

Pour tester si l’installation s'est bien déroulée, vous pouvez :

  1. Tester Python

  2. Tester le notebook Jupyter

Installer Python sans notebook

Pour savoir si python est déjà installé sur votre ordinateur, ou pour le tester une fois que vous l'aurez installé, rendez-vous ici.

Normalement, il est préférable d'installer toutes les fonctionnalités d'un coup : Python, les librairies que nous utiliserons, et le notebook Jupyter. Je vous conseille donc de vous rendre à cette section. Si pour une quelconque raison, vous souhaitez tout installer séparément, alors vous trouverez dans ce cours les instructions pour installer Python. :)

Installer Python avec notebook

Si vous ne souhaitez pas installer Anaconda, vous pouvez suivre les instructions suivantes, après avoir  installé Python :

Assurez-vous que le programme  pip  est installé sur votre ordinateur. Pou cela, tapez tout simplement  pip  dans une console. Normalement, le programme pip s'est installé en même temps que Python.

Tapez ensuite ces lignes de code l'une après l'autre :

python -m pip install --upgrade pip
python -m pip install jupyter

Pour vérifier si l'installation s'est bien déroulée, rendez-vous à la section Lancer et tester Jupyter.

Tester si Python est installé

Pour tester Python, ouvrez une console (si vous ne savez pas comment faire, c'est par ici), et tapez-y tout simplement :

python

... puis validez grâce à la touche Enter de votre clavier. Il devrait normalement s'afficher quelque chose qui ressemble vaguement à cela :

 

Si c'est le cas, c'est que vous êtes en train d'interagir avec Python ! Tapez maintenant ceci :

3 + 2

Validez grâce à la touche Entrer. Si Python vous répond  5, c'est que tout est bon !

Pour quitter Python, il faut utiliser le raccourci clavier Ctrl + D.

Tester Python avec un fichier de script

A ce stade, vous devez choisir si vous souhaitez utiliser Python avec un notebook ou pas. Si ce n'est pas le cas, il vous faudra écrire votre programme dans un fichier. Mais dans tous les cas, il est indispensable de savoir comment faire :

  • Créez un fichier et nommez-le  monscript.py  .

  • Ouvrez ce fichier avec un éditeur de texte, écrivez-y  print(3+2)  , puis sauvegardez le fichier.

  • Ouvrez une console et placez-vous dans le répertoire (le dossier) dans lequel vous venez de créer votre fichier.

  • Dans la console, saisissez la commande suivante :

python monscript.py

Normalement, il devrait s'afficher le résultat du calcul 3+2, c'est-à-dire 5.

Lancer et tester Jupyter

Pour lancer Jupyter, ouvrez une console, puis tapez-y ceci :

jupyter notebook

Il devrait s'afficher quelque chose qui ressemble à ceci :

 

Normalement, votre navigateur (Firefox, Chrome, Safari, Internet Explorer, Edge, etc...) devrait se lancer automatiquement.

Dans votre navigateur devrait s'afficher la liste des dossiers et fichiers présents dans le répertoire à partir duquel vous avez lancé le programme Jupyter :

Lancer Jupyter
Lancer Jupyter

Bravo ! Vous avez lancé le programme Jupyter. Pour tester les fonctionnalités du notebook avec Python, poursuivez votre lecture ci-dessous, en créant un nouveau notebook.

Créer un nouveau notebook

A partir de la fenêtre principale de Jupyter, cliquez sur "New" puis sur "Python 3", comme ceci :

Créer un notebook Python
Créer un notebook Python

Un fichier nommé  Untitled.ipynb  s'est normalement créé dans le répertoire à partir duquel vous avez lancé Jupyter.

Votre navigateur devrait vous afficher le notebook créé. Pour le tester, tapez 2 + 5  dans la case (cellule) vide au centre de la fenêtre. Cliquez ensuite sur ce bouton :

Exécuter une cellule du notebook
Exécuter une cellule du notebook

Il devrait s'afficher le résultat de l'opération : 7.

Lancer un notebook déjà créé

Une fois votre notebook créé, vous pouvez y ré-accéder à tout instant en ouvrant une console, en vous plaçant dans le répertoire qui contient votre notebook (que vous appelons ici  Untitled.ipynb  ) puis en saisissant dans la console cette ligne :

jupyter notebook Untitled.ipynb

Normalement, votre navigateur devrait s'ouvrir automatiquement et afficher votre notebook !

Ouvrir une console

Sous Windows

Sous Windows, la console s'appelle "Invite de commandes". Les dernières versions de Windows étant très différentes, je vous invite à consulter cette page pour savoir comment lancer la console : https://fr.wikihow.com/ouvrir-l%27Invite-de-commandes-sous-Windows

Changer de répertoire dans une console Windows

Quand votre console s'ouvre, vous êtes situé dans un certain dossier (ou "répertoire"). On l'appelle "Répertoire (ou dossier) courant". Pour savoir quel est votre répertoire courant, tapez  cd  dans la console. Pour changer de répertoire, tapez  cd Documents  pour vous déplacer dans le dossier "Documents" par exemple. Bien entendu, remplacez "Documents" par le dossier dans lequel vous souhaitez vous déplacer. Si vous ne savez pas par où vous déplacer, tapez  dir  , qui affichera tous des dossiers et tous les fichiers présents dans le dossier courant. Pour "remonter" d'un répertoire en arrière (appelé "Dossier parent"), tapez  cd ..  ("cd" suivi de 2 points). Voilà, vous savez l'essentiel !

Sous Linux

Sous Ubuntu, tapez ce raccourci clavier : Ctrl + Alt + T

Changer de répertoire dans une console Linux

Quand votre console s'ouvre, vous êtes situé dans un certain dossier (ou "répertoire"). On l'appelle "Répertoire (ou dossier) courant". Pour savoir quel est votre répertoire courant, tapez  pwd  dans la console. Pour changer de répertoire, tapez  cd Documents  pour vous déplacer dans le dossier "Documents" par exemple. Bien entendu, remplacez "Documents" par le dossier dans lequel vous souhaitez vous déplacer. Si vous ne savez pas par où vous déplacer, tapez  ls  , qui affichera tous des dossiers et tous les fichiers présents dans le dossier courant. Pour "remonter" d'un répertoire en arrière (appelé "Dossier parent"), tapez  cd ..  ("cd" suivi de 2 points). Voilà, vous savez l'essentiel !

Sous Mac

Lancez le Finder grâce à cette icône :

Une fenêtre similaire à celle-ci devrait s'ouvrir :

(source : support.apple.com)
(source : support.apple.com)

Cliquez ensuite sur "Applications" disponible dans la partie gauche de la fenêtre, puis sur "Utilitaires" (ou "Utilities" en anglais) disponible dans la partie centrale. Dans le dossier Utilitaires devrait se trouver un programme nommé "Terminal". lancez-le, vous êtes dans votre console !

Changer de répertoire dans ne console Mac

Quand votre console s'ouvre, vous êtes situé dans un certain dossier (ou "répertoire"). On l'appelle "Répertoire (ou dossier) courant". Pour savoir quel est votre répertoire courant, tapez  pwd  dans la console. Pour changer de répertoire, tapez  cd Documents  pour vous déplacer dans le dossier "Documents" par exemple. Bien entendu, remplacez "Documents" par le dossier dans lequel vous souhaitez vous déplacer. Si vous ne savez pas par où vous déplacer, tapez  ls  , qui affichera tous des dossiers et tous les fichiers présents dans le dossier courant. Pour "remonter" d'un répertoire en arrière (appelé "Dossier parent"), tapez  cd ..  ("cd" suivi de 2 points). Voilà, vous savez l'essentiel !

Erreurs fréquentes

Aucune erreur fréquente recensée à ce jour.

Exemple de certificat de réussite
Exemple de certificat de réussite