Comme pour tous les sujets intéressants, nous avons besoin de quelques préparatifs pour bien nous lancer dans l'analyse de données avec Python.
Ce que nous allons faire dans ce chapitre
Comment s'orienter dans ce vaste chapitre ?
Si vous n'avez jamais intallé installé Python, alors il existe une solution miracle, qui installera directement Python, toutes les librairies nécessaires, ainsi que le notebook Jupyter !
Si vous avez déjà installé Python, alors vous aurez besoin d'installer le notebook Jupyter, ainsi que les librairies suivantes :
Pandas
Matplotlib
Numpy
SciPy
Installer la totale : Python + librairies + notebook (distribution Anaconda)
En gros, une distribution, c'est un langage de programmation + certaines librairies et autres fonctionnalités.
Anaconda est donc une distribution Python, faite pour la Data Science.
Il installera donc :
Python
les librairies de Data Science dont nous aurons besoin : Matplotlib, Scipy, Numpy, Pandas
le notebook Jupyter, que je vous conseille vivement d'utiliser
Pour télécharger la distribution Anaconda, c'est par ici : https://www.anaconda.com/distribution/
Installer Anaconda sous Windows ou Mac
Téléchargez le fichier d'installation pour Windows ou MacOs, puis lancez-le en double-cliquant sur le fichier qui s'est téléchargé.
Répondez aux questions qui vous sont posées. Les options par défaut sont en général acceptables, pas besoin de les modifier. Une fois l'installation terminée, vérifiez que tout s'est bien passé en lançant le programme Jupyter (voir ci-dessous).
Installer Anaconda sous Linux Ubuntu
Ouvrez une console
Optionnellement, placez-vous dans le répertoire dans lequel vous souhaitez télécharger et décompresser les fichiers d'installation, grâce à la commande
cd
.Adaptez la commande ci dessous en remplaçant 2020-02 par la dernière version disponible d'Anaconda (vous pouvez trouver le numéro de version sur cette page : https://www.anaconda.com/distribution/.
wget https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh
Une fois adaptée, lancez cette commande.
Le fichier est assez volumineux, et peut prendre quelques secondes à être téléchargé. Une fois qu'il est téléchargé, vous pouvez vérifier sa présence grâce à la commande
ls
.Adaptez la commande suivante en fonction de la version, puis exécutez-la.
bash Anaconda3-2020.02-Linux-x86_64.sh
Ceci lance le processus d'installation d'Anaconda. Vous devrez accepter la licence d'utilisation. Choisissez d'installer Anaconda dans le répertoire par défaut, et patientez. A la fin de l'installation, répondez
yes
à la question suivante :
Do you wish the installer to prepend the Anaconda3 install location to PATH in your /home/ec2-user/.bashrc ? [yes|no]
La commande précédente a ajouté au fichier .bashrc le chemin (le dossier) dans lequel se trouve Anaconda. Ainsi, vous pourrez lancer Anaconda directement en tapant seulement
anaconda
dans votre console ! Cette opération prendra effet au redémarrage de votre ordinateur, ou dès l'exécution de cette commande :
source .bashrc
Vérifiez que tout s'est bien passé en lançant le programme Jupyter (voir ci-dessous)
Lancer le programme Jupyter
Sous MacOs, lancez Anaconda Navigator à partir du Launchpad (repérable sur votre Bureau grâce à l'icône
).
Sous Linux Ubuntu, ouvrez une console et lancez la commande
anaconda-navigator
.Sous Windows, lancez Anaconda Navigator en le recharchant dans les programmes (selon la version de Windows, vous le trouverez probablement en cliquant sur démarrer > (Programmes) > Anaconda > Anaconda Navigator :
Une fois le navigateur Anaconda lancé, plusieurs applications vous sont proposées. Cliquez sur Jupyter :
Installer uniquement le notebook Jupyter (sans Anaconda)
Si vous ne souhaitez pas installer Anaconda, vous pouvez suivre les instructions suivantes, après avoir installé Python :
Assurez-vous que le programme pip
est installé sur votre ordinateur. Pour cela, tapez tout simplement pip
dans une console. Normalement, le programme pip s'est installé en même temps que Python.
Tapez ensuite ces lignes de code l'une après l'autre :
python -m pip install --upgrade pip python -m pip install jupyter
Pour vérifier si l'installation s'est bien déroulée, tapez dans votre console la commande suivante :
jupyter notebook
Vous êtes maintenant prêt(e) à créer un nouveau notebook !
Installer uniquement les librairies Python (sans Anaconda)
Assurez-vous que le programme pip
est installé sur votre ordinateur. Pour cela, tapez tout simplement pip
dans une console. Normalement, le programme pip s'est installé en même temps que Python. Si ce n'est pas le cas, vous pouvez visiter cette page.
Ensuite, saisissez dans votre console ces commandes :
pip install scipy pip install numpy pip install matplotlib pip install pandas