• 12 heures
  • Difficile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 18/11/2022

Découvrez le jeu de données de l'ozone

L'ozone est un polluant photochimique, dont de nombreux instituts cherchent à prévoir les pics pour prévenir les populations. La pollution automobile, l'absence de vent et la chaleur comptent parmi les facteurs qui accroissent le taux de pollution.

Le jeu de données de l'ozone

On considère à cet effet un jeu de données issu du Laboratoire de mathématiques appliquées de l'Agrocampus Ouest qui contient 112 données recueillies à Rennes durant l'été 2001. On y trouve les 14 variables suivantes :

  • obs : mois-jour ;

  • maxO3 : teneur maximale en ozone observée sur la journée (en $\(\mu\gr/m^3\)$ ) ;

  • T9, T12, T15 : température observée à 9 h, 12 h et 15 h ;

  • Ne9, 12, Ne15 : nébulosité observée à 9 h, 12 h et 15 h ;

  • Vx9, Vx12, Vx15 : composante est-ouest du vent à 9 h, 12 h et 15 h ;

  • maxO3v : teneur maximale en ozone observée la veille ;

  • vent : orientation du vent à 12 h ;

  • pluie : occurrence ou non de précipitations.

Objectif de notre analyse

On souhaite étudier le lien entre le pic d'ozone journalier et un certain nombre de facteurs potentiellement explicatifs afin de proposer un modèle de régression permettant de prévenir la population.

Par exemple, la simple visualisation du nuage de points entre le pic d'ozone journalier et la température mesurée à 12 h permet d'ores et déjà d'envisager une relation linéaire :

                                                          $\(maxO3 \approx\beta_1+\beta_2T12\)$  

figure 1.1 : Ozone nuage de points
Ozone nuage de points

Sur ce jeu de données, on voit déjà qu'une régression linéaire sera une modélisation intéressante. Parfait !

Voyons maintenant notre deuxième jeu de données, portant sur des maladies cardio-vasculaires...

Exemple de certificat de réussite
Exemple de certificat de réussite