• 6 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 27/11/2023

Analysez des séries temporelles

Vous avez vu dans le chapitre précédent comment réaliser une analyse descriptive de vos données. Ce type d’analyse permet de comprendre les données avant de réaliser d’autres types d’analyses.

Comme nous avons des dates dans nos données, nous pouvons réaliser une analyse temporelle, qui va se décomposer en série temporelle et en moyenne mobile. Pour finir, nous utiliserons la feuille de prévision d’Excel pour prédire des valeurs.

Appréhendez la spécificité des séries temporelles

Les séries temporelles sont monnaie courante dans les différentes analyses que vous allez faire. Pour faire une analyse temporelle, vous aurez besoin d’une variable de temps.

C’est facile, on va utiliser des dates !

Effectivement, nous allons souvent utiliser des dates, mais surtout toutes les déclinaisons des dates. Cette variable temporelle va pouvoir prendre plusieurs formes avec par exemple :

  • des secondes ;

  • des minutes ;

  • des jours ;

  • des semaines ;

  • des mois ;

  • des années ;

  • etc.

Vous pouvez également ajouter d’autres formes de variables temporelles, telles que les numéros des semaines, les jours de la semaine ou encore des plages horaires. Il y a assez peu de limites à la variable temporelle que vous allez prendre.

Certaines entreprises utilisent les clôtures des comptes, qui peuvent arriver le 30 avril, comme variables temporelles. Ce n’est pas un trimestre, ce n’est pas un semestre, c’est juste une période définie par l’entreprise, qui va aller du 1er mai au 30 avril de l’année suivante. Cette période est une variable temporelle pour l’entreprise.

La majorité du temps, vous allez vous retrouver avec des variables sous la forme de dates ou de timestamp (ou horodatage en français).

Souvent, vous allez devoir modifier votre fichier pour calculer les semaines, les mois ou encore les jours.

Dans notre cas, j’ai ajouté une formule Excel dans la colonne "mois" (=MOIS(“votre date”)) et dans la colonne "semaine" (=NO.SEMAINE(“votre date”),11).

Impression d'écran de l'exemple qui montre plusieurs lignes datées le 26/06/2023, avec à chaque ligne le mois
Ajout des colonnes mois et semaine dans Excel

La particularité des données temporelles, c’est qu’elles s’apprécient dans un certain ordre. Si vous regardez l’évolution des ventes du mois de janvier, vous souhaitez commencer par le 1er janvier, puis le 2 janvier, puis le 3 janvier, etc.

Il faut donc que vos données soient initialement triées afin que vous puissiez voir leur évolution dans le temps. Contrairement aux autres données, si celles-ci ne sont pas triées, elles ne sont pas vraiment exploitables, car ce que nous recherchons dans ce genre d’analyse, c’est l’évolution dans le temps des données.

Maintenant que nous avons transformé nos données temporelles, nous allons pouvoir les exploiter plus facilement.

Pour commencer, nous allons faire un premier graphique à partir d’un tableau croisé dynamique (TCD pour les intimes). L’avantage du TCD, c’est qu’il permet d'agréger les données par jour.

En effet, si nous regardons nos données, nous allons nous apercevoir que pour le 2 janvier, nous avons eu 20 ventes. Nous, nous souhaitons n’avoir qu’une seule donnée pour ce jour-là et pas 20 données. Nous pouvons alors choisir la façon de les agréger en utilisant par exemple une somme, une moyenne, un minimum, une médiane, le nombre de transactions, etc. Dans notre cas, nous allons choisir dans un premier temps de regarder la moyenne des valeurs foncières par jour. Je vous laisse regarder le screencast pour comprendre comment faire un TCD en affichant les jours et la moyenne des valeurs foncières.

Le screencast vous montre une première série temporelle avec les jours, auxquels nous avons ajouté les mois afin de mieux découper l’analyse.

Nous pouvons voir que cette moyenne oscille le plus souvent entre 400 000 € et 800 000 €. Nous notons également de gros pics à 1,4 million et des minimums autour des 100 000 à 200 000 €. Ce graphique nous montre les transactions moyennes sur Paris par jour :

Représentation visuelle de l'oscillation de la moyenne par jour, montrant de grandes différences entre les pics et les creux.
Analyse temporelle de la moyenne des valeurs foncières par jour dans Excel

Nous pouvons retirer la notion de jour pour avoir un graphique plus lisible avec seulement la valeur foncière moyenne par mois.

La courbe est plus graduelle, montrant les tendances.
Analyse temporelle de la moyenne des valeurs foncières par mois dans Excel

Maîtrisez le concept de moyenne mobile

Nous avons vu précédemment comment faire une analyse temporelle. Cependant, il arrive parfois que cette analyse ne soit pas suffisante pour comprendre facilement nos données.

Nous allons reprendre notre exemple, mais, cette fois, à la place de la moyenne des valeurs foncières par jour, nous allons mettre le nombre total de transactions par jour.

La courbe fluctue en fonction du jour, avec de grands écarts. Nous remarquons une certaine répétition dans la forme de la courbe chaque semaine.
Représentation du nombre d’actes d’achat par jour à Paris

Nous observons cependant qu’un pattern revient tout le temps : un chiffre proche de 0, puis cela remonte doucement pour atteindre un maximum et cela redescend. Cette forme se répète de façon plus ou moins intense tout au long de notre graphique.

En regardant de plus près, nous voyons que les minimums tombent toujours les samedis, et il n’y a pas de données les dimanches. Si nous mettons un peu de contexte, nous savons que les notaires sont le plus souvent fermés le samedi ou ouverts uniquement le samedi matin, cela est donc logique qu’il y ait peu de transactions. De même, tous les notaires sont fermés le dimanche, c’est ainsi normal que nous n’ayons pas de transactions.

Ajoutons à présent le numéro des semaines dans une nouvelle colonne avec la formule  JOURSEM  (=JOURSEM(“votre date”), “choix début”). Cette fonction permet de renvoyer le numéro du premier jour de la semaine. Ce premier jour est paramétrable avec le deuxième argument dans la formule. De mon côté, j’ai choisi le numéro 2 qui permet de renvoyer un 1 pour le lundi, un 2 pour le mardi, etc.

Il y a plusieurs lignes, avec la date Mutation  la colonne avec les mois à 1, la semaine à 2 et le jour_semaine qui varie. La Nature de la mutation s'affiche comme
Ajout de la colonne "Jour_semaine" dans Excel

Nous allons maintenant refaire le graphique, toujours à l’aide de notre TCD, mais cette fois en affichant seulement les numéros des semaines et les jours de la semaine.

La courbe montre un pattern à nouveau, facilement lisible avec les numéros de jour de la semaine qui montre la saisonnalité des données qui se répète chaque semaine.
Représentation du nombre d’actes d’achat par semaine et numéro du jour de la semaine

Nous voyons très bien dans ce cas qu’il y a une saisonnalité dans nos données, car le schéma se répète chaque semaine.

Ce n'est pas mal cet exemple, mais je ne sais pas vraiment où on veut en venir.

Nous y arrivons, je peux vous demander maintenant de me dire ce que vous pensez de cette courbe et quelle est sa tendance, mais, personnellement, j’ai du mal visuellement à savoir ce qu’il se passe.

Il existe une méthode pour lisser les courbes qui s’appelle la moyenne mobile. Je vous laisse me suivre dans le screencast pour la création de cette moyenne :

Dans notre exemple, nous avons fait une moyenne mobile visuelle sur un graphique. Nous aurions également pu fabriquer nous-mêmes cette moyenne mobile avec la formule  MOYENNE  . Chaque jour, vous allez faire la moyenne des six derniers jours. Alors, vous allez me demander pourquoi nous ne faisons pas la moyenne des sept derniers jours, vu que c’est une récurrence sur chaque semaine. Car il n’y a pas de données pour le dimanche, la ligne n’existe pas, donc je ne peux pas compter ce jour-là. 

Effectuez une prévision temporelle dans Excel

Maintenant que nous avons analysé en détail notre série temporelle, nous souhaitons faire une modélisation. Nous désirons faire une prévision sur les trois prochains mois du nombre de transactions qu’il va y avoir à Paris.

Pour cela, nous allons utiliser les mêmes données, à savoir, le nombre de transactions par jour. Il y a dans Excel un module de prévision directement intégré, que vous pouvez retrouver en allant dans “Données”, puis en cliquant sur “Feuille de prévision”. Je vous laisse me rejoindre dans le screencast pour que nous paramétrions ensemble cette prévision :

Prévision du nombre de transactions pour le mois de juillet
Prévision du nombre de transactions pour le mois de juillet

Nous pouvons également lancer l’outil de simulation directement en VBA en utilisant "Workbook.CreateForecastSheet" avec les différents paramètres de cette fonction.

ActiveWorkbook.CreateForecastSheet Timeline:=Sheets("P2C2 graph").Range( _
"A490:A645"), Values:=Sheets("P2C2 graph").Range("B490:B645"), ForecastEnd _
:="30/09/2023", ConfInt:=0.95, Seasonality:=7, ChartType:= _
xlForecastChartTypeLine, Aggregation:=xlForecastAggregationAverage, _
DataCompletion:=xlForecastDataCompletionInterpolate, ShowStatsTable:=False

À vous de jouer !

 

Toujours dans un souci d’optimisation de votre analyse, votre chef vous demande maintenant de lui faire des graphiques qui permettent de comprendre l’évolution du chiffre d’affaires.

Il vous demande donc de :

  • créer un graphique représentant l’évolution du chiffre d’affaires global (graphique en ligne) ;

  • créer un graphique avec deux courbes (une pour chaque marque) avec la moyenne mobile sur deux mois pour chaque courbe ;

  • faire un graphique de l'évolution dans le temps de la répartition du chiffre d'affaires pour les produits Gluten Free et Bio (un graphique pour chaque) ;

  • prévoir le chiffre d'affaires des deux marques pour les deux prochains mois.

Il souhaite également que tout cela soit bien entendu automatique, car nous allons suivre les indicateurs chaque mois. Il vous laisse cependant le choix de coder vous-même la création de tous les indicateurs ou de passer par des TCD que votre code mettra à jour.

Vous avez trouvé la solution ? Je vous montre la correction en screencast :

En résumé

  • Les séries temporelles sont des graphiques qui permettent de comprendre l’évolution dans le temps d’une variable.

  • On peut décomposer une date en plusieurs variables comme les jours de la semaine, les semaines, les trimestres, des périodes spécifiques, des heures, etc.

  • Pour lisser les séries temporelles ou pour gommer les variations saisonnières, on utilise une moyenne mobile.

  • Les prévisions des séries temporelles se font sur les historiques en gardant les variations saisonnières.

Vous avez vu dans ce chapitre que vous pouvez utiliser une série temporelle pour comprendre l’évolution d’une variable. Voyons dans le prochain chapitre comment réaliser des tests statistiques.

Exemple de certificat de réussite
Exemple de certificat de réussite