• 12 heures
  • Difficile

Ce cours est visible gratuitement en ligne.

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 19/02/2024

Identifiez les différentes méthodes de sauvegarde

La pause-café est un monde merveilleux ! C’est cette pause-café, prise exceptionnellement à 10 h 35 au lieu de 10 h 15, qui vous a permis de faire la connaissance de toute l’équipe des ressources humaines et du recrutement.

Vous avez eu le plaisir de rencontrer Mickael, votre gestionnaire RH, et au fil de la conversation, vous avez su avoir la curiosité de comprendre son métier et comment il s'organise.

C’est cette pause-café qui vous a permis de savoir que Mickael ne traite les salaires que le dernier jour du mois, pour que les virements des collaborateurs partent en date du 5 du mois suivant.

À votre avis, que se passerait-il si le 15 décembre, il perdait ses données, et que vous n’avez qu’une sauvegarde du 1er décembre ?

Eh bien…rien, je dirais ?

Exactement ! Et c’est un très bon exemple d’une planification et d’une analyse de la fréquence de sauvegarde nécessaires, et une super transition vers la notion de fenêtre et de fréquence de sauvegarde.

Déterminez la bonne fenêtre de sauvegarde

Si vous vous intéressez un peu au domaine de l’aérospatial, vous connaissez sûrement le terme de “fenêtre de tir” ou “fenêtre de lancement”, qui correspond à l’intervalle de temps où les conditions sont les plus propices pour le lancement réussi d’une fusée.

Eh bien, figurez-vous qu’en matière de sauvegarde, c’est pareil !

Est-ce que je ne pourrais pas considérer la journée entière comme la fenêtre de sauvegarde, et mettre en place une sauvegarde toutes les heures de toutes mes données, pour ne plus avoir de risque de perte ?

Attendez ! Avant de décider de votre fenêtre de sauvegarde, il faut au préalable que je vous parle d’un point : l’impact de la sauvegarde sur les données et l’infrastructure.

Au cas où vous n’auriez plus le cheminement en tête, voici schématiquement les étapes d’une sauvegarde :

  1. Un serveur de sauvegarde ou un script commence le processus de sauvegarde.

  2. La donnée est prise d’une source et est dupliquée vers une destination : le support de stockage.

  3. Cette duplication implique que la donnée source soit lue sur le disque par le programme de copie.

  4. Des petits paquets, fragments de la donnée source, transitent sur le réseau, de la source vers le serveur de stockage.

  5. Les paquets sont reconstitués sur le support, pour reformer la donnée sauvegardée.

  6. Une somme de contrôle (checksum) est effectuée sur la donnée source et la donnée sauvegardée pour vérifier que celle-ci n’a pas été corrompue durant le transport (en fonction de l’outil utilisé).

Chaque opération va soit utiliser du temps CPU, en d’autres termes, le processeur, soit effectuer des opérations de lecture sur les disques.

Toutes ces opérations vont bien entendu risquer de ralentir le système. Et sur un système en production, ce n’est pas envisageable.

De plus, si les sauvegardes sont distantes, il y a un risque de saturer les équipements réseau et de ralentir toute l’infrastructure.

C’est entre autres pour cette raison que les sauvegardes sont généralement planifiées la nuit, les week-ends, ou plus généralement en heures non ouvrées (HNO).

Une fenêtre de sauvegarde est souvent disponible lors des heures non ouvrées.

Je vois. Mais concrètement, quels pourraient être les impacts ?

Dans le cas où vous exécuteriez les sauvegardes pendant que tout le monde travaille, les impacts pourraient être variés ; par exemple :

  • forte latence dans l’ouverture ou le listing des fichiers ;

  • blocage de données opérationnelles : certains systèmes, comme des bases de données bancaires, doivent être inaccessibles pour être sauvegardés ;

  • accès aux sites internet/intranet particulièrement lent. Ce qui peut jouer sur l’image de l’entreprise ;

  • perte de productivité globale.

Vous comprendrez donc que si vous faites une sauvegarde de toutes vos données toutes les heures, déjà vous n’aurez pas forcément le temps de terminer une précédente sauvegarde que la suivante risque de commencer, mais en plus, vous risquez de paralyser le travail de tous les collaborateurs.

Vous saisissez mieux l’importance de la fenêtre de sauvegarde ?

Oui, je comprends mieux. Je vais éviter de planifier les sauvegardes pendant que les collègues travaillent… Mais comment je fais si j’ai des traitements particuliers la nuit ?

Excellente question. Et je ne saurais vous répondre pour une raison simple : chaque cas est différent. C’est à vous, avec les informations que vous possédez, avec vos contraintes opérationnelles, de définir la meilleure fenêtre !

Mais vous soulevez là un point important. Toutes les entreprises n’auront pas les mêmes fenêtres de sauvegarde. Certaines pourront même avoir des fenêtres très réduites.

Regardez vous-même, avec ces quelques cas de figure :

  • Une entreprise internationale de gestion de risques bancaires.

  • Une industrie de production laitière.

  • Une start-up dans l’innovation énergétique.

  • Un chantier de développement et construction navals.

Ces quatre entreprises auront probablement une fenêtre de sauvegarde différente. La première, étant à l’international, devra peut-être segmenter ses sauvegardes sur de très courtes fenêtres, et les optimiser.

Une industrie laitière va travailler sur des horaires peut-être plus décalés, le temps que les camions de lait arrivent.

La start-up sur des horaires peut-être de bureau, avec une large fenêtre la nuit, là où le chantier de développement et de construction naval aura possiblement une fenêtre plus réduite, la nuit uniquement quand les calculs chronophages seront terminés.

Calendrier de sauvegarde composé du temps de traitement métier, des créneaux de sauvegarde libres et du temps de présence des collaborateurs.
Calendrier de sauvegarde

Un planning plus visuel des fenêtres de sauvegarde peut être fait pour mieux s’organiser.

Choisissez la meilleure fréquence de sauvegarde

Avoir une fenêtre de sauvegarde optimale, c'est important, mais savoir à quelle fréquence l’utiliser, c’est essentiel.

Imaginez que vous ayez défini que votre fenêtre de sauvegarde soit la nuit du lundi au vendredi de 21 h à 4 h du matin, ainsi que sur la totalité du samedi et du dimanche.

Rien ne dit que vous allez exécuter toutes vos sauvegardes sur ces fenêtres.

Et au contraire, si toutes les fenêtres sont utilisées pour toutes les sauvegardes, en fonction du volume, vous pourriez ne pas arriver à sauvegarder l’entièreté des données…

C’est sûr que si on sauvegarde tous les jours les mêmes 50 % des données, on ne va pas s’y retrouver…

Non. Et ça représente un gros risque.

Pour pouvoir déterminer la fréquence de la sauvegarde, il faut prendre en compte la criticité de la donnée, mais aussi la vie de celle-ci et à quelle vitesse elle change.

Dans notre exemple précédent, la pause-café vous a permis de comprendre que la donnée n’évolue que dans une petite période, à la fin du mois, et particulièrement le dernier jour. Il n’est donc pas nécessaire de mettre en place une sauvegarde quotidienne.

A contrario, des données de production comme des transactions monétaires ou la conception d’un futur moteur à hydrogène sont des données qui évoluent beaucoup au fil du temps. Cela couplé à une criticité élevée nécessitera une fréquence de sauvegarde à intervalle plus court. Tous les jours, par exemple.

Planification des sauvegardes sur un mois.
Planification des sauvegardes sur un mois

Découvrez les méthodes de sauvegarde

Les deux points précédents vous auront permis de voir que les sauvegardes avaient besoin de temps, de ressources et d’une fenêtre disponible.

D’accord, mais comment je vais faire pour réussir à planifier toutes mes sauvegardes tous les jours ?

Rassurez-vous, il y a un point dont nous n’avons pas encore parlé et qui devrait vous permettre de sauvegarder plus sereinement : la méthode de sauvegarde.

La méthode de sauvegarde va dépendre des éléments que nous avons précédemment pu voir, et consiste en :

  • Sauvegarde complète : la totalité de la donnée est copiée.

  • Sauvegarde incrémentale : les modifications depuis la dernière sauvegarde incrémentale sont copiées. Les sauvegardes sont plus petites, et donc prendront moins d’espace disque, de ressources et de temps d’exécution.

  • Sauvegarde différentielle : les modifications depuis la dernière sauvegarde complète sont copiées. Il s’agit d’une sauvegarde cumulative, de plus en plus grande.

Le schéma suivant vous permet de mieux différencier la sauvegarde incrémentale de la sauvegarde différentielle :

Comparaison entre sauvegarde incrémentale et sauvegarde différentielle.
Comparaison entre sauvegarde incrémentale et sauvegarde différentielle

Détaillons le schéma :

Une sauvegarde complète est effectuée le lundi.

À gauche, vous avez la sauvegarde incrémentale :

  • Chaque jour, les modifications depuis la dernière sauvegarde incrémentale sont sauvegardées.

  • Ex. : le mercredi, toutes les modifications depuis la sauvegarde du mardi (la dernière sauvegarde effectuée) sont sauvegardées.

À droite, la sauvegarde différentielle :

  • Chaque jour, les modifications depuis la dernière sauvegarde complète sont sauvegardées.

  • Exemple : mercredi, on sauvegarde l’ensemble des modifications depuis le lundi (sauvegarde complète).

Top ! Alors, je peux me permettre dans ce cas de ne faire que des sauvegardes incrémentales. Et une complète une fois par mois ou par trimestre, même.

Oui, c’est possible… Mais je ne vous recommande pas forcément cette stratégie. Car si vous avez, pour quelque raison, une restauration à faire d’urgence, vous allez devoir restaurer la dernière complète et toutes les incrémentales. Ce qui risque d’être long.

Rappelez-vous que si votre sauvegarde est trop longue, elle risque de ne pas être totalement terminée à la fin de la fenêtre de sauvegarde, et que si la fréquence n'est pas adaptée, vous risquez là encore de manquer de temps pour tout copier.

Je vous propose un petit tableau récapitulatif pour vous aider à vous y retrouver dans les méthodes de sauvegarde et vous aider à choisir lesquelles mettre en place :

Type de sauvegarde

Données sauvegardées

Durée de sauvegarde

Impact sur la production

Fréquence à privilégier

Complète

Toutes

Longue

Fort

Hebdomadaire

Incrémentale 

Modifications depuis la dernière sauvegarde

Courte

Faible

Quotidienne ou encore plus fréquente

Différentielle

Modification depuis la dernière sauvegarde complète

Variable. Augmente à chaque sauvegarde

Moyen

Quotidienne

Enfin, il existe une autre méthode de sauvegarde permettant de réduire le temps de sauvegarde tout en faisant une sauvegarde complète : la sauvegarde synthétique.

Celle-ci représente une fusion de la sauvegarde complète et des différentes sauvegardes incrémentales ou différentielles. Pour schématiser, l’outil va assembler la dernière complète et les incrémentales (ou la différentielle) précédentes pour les transformer en une nouvelle sauvegarde complète.

Le plus gros avantage de cette solution est que l’impact ne sera plus sur le système de production, mais sur l’infrastructure de sauvegarde (serveur de sauvegarde, serveur proxy, stockage de sauvegarde).

Cela est très utile lorsque la fenêtre de sauvegarde est très réduite ou lorsque la durée des sauvegardes dépasse la fenêtre prévue.

Décomposition d'une sauvegarde synthétique.
Décomposition d'une sauvegarde synthétique

Prenez en main la réplication de données

Je comprends bien l’intérêt de sauvegarde pour mes données. Mais qui sauvegarde mes sauvegardes ? Qu’est-ce qui se passe si jamais un virus me détruit mes données ET mes sauvegardes ?

Excellente question. Et qui va nous permettre de soulever un point trop souvent négligé : la réplication des données.

Imaginez la situation suivante :

Vous vous préparez à gérer la demande de Mickael, votre gestionnaire RH qui attend toujours que vous l’aidiez à restaurer les justificatifs des collaborateurs. Vous vous connectez à l’outil de sauvegarde et là : impossible de restaurer quoi que ce soit.

Vous essayez d’accéder à l’emplacement des sauvegardes directement, et celui-ci semble avoir rendu l’âme.

Situation plus que stressante, n'est-ce pas ?

Maintenant, comment réagiriez-vous si vous aviez eu un autre environnement de sauvegarde qui aurait sauvegardé les données de la première sauvegarde ?

Vos sauvegardes n’auraient pas été perdues, mais toujours présentes dans un stockage secondaire.

Eh bien cette logique de “sauvegarde de sauvegardes” se nomme de la réplication de données !

Réplication de données.
Réplication de données

Votre donnée est présente en maintenant 3 exemplaires : l’originale, la sauvegarde, la version répliquée.

N’hésitez pas à mettre vos données répliquées dans des lieux de stockage différents, pour vous prémunir du risque de perte des données et des réplications en cas de sinistre.

Vous n’avez plus qu’à vous connecter sur le stockage secondaire et à restaurer les justificatifs demandés par Mickael, avant d’aller remettre en état votre environnement de sauvegarde.

Comprenez le principe d’archivage

Ce qui est bien quand un dysfonctionnement survient, c’est que ça permet de mettre en avant tout ce qui ne va pas autour de cette problématique.

Oui, enfin, ça ne serait quand même pas mieux si les dysfonctionnements n’arrivaient pas et si les analyses de risques avaient été bien faites ?

Ça, je vous l’accorde ! Et en matière d’analyse et de proactivité, vous allez voir qu’il y a un autre point qui peut être pris en considération.

  • L’environnement de sauvegarde qui va recevoir vos données n’est pas extensible, peut se remplir rapidement, et doit être toujours fiable et disponible. Il est aussi essentiel de comprendre que vous ne pouvez pas toujours stocker 100 % de vos sauvegardes sur des durées infinies. 

  • Autre point à considérer dans vos sauvegardes. Légalement, Mickael doit garder une copie des dossiers et justificatifs sur une durée de 5 ans. Cette durée légale de conservation de la donnée et l’espace de stockage qui n’est pas extensible à l’infini sont deux éléments qui vont nous permettre de parler des points suivants : le temps de rétention, et l’archivage des sauvegardes.

Nous allons faire un petit calcul très rapide.

  • Disons que vous avez un espace de stockage de 1 To, et que toutes les semaines, vous avez une sauvegarde complète de… allez… 100 Go, et des incrémentales de 1 Go. C’est pour illustrer, bien sûr.

  • Au bout de 2 mois, en gardant toutes vos sauvegardes complètes, soit environ 9 semaines, vous atteindriez 900 Go. Vous auriez encore de la place pour vos incrémentales, mais pour une complète… ce serait trop limite.

  • Et si vous devez restaurer une donnée d’il y a 4 mois… eh bien ce ne sera plus possible. 

Revenons maintenant à Mickael, qui va bientôt se faire auditer. Une des choses qu’il est censé pouvoir fournir, ce sont les dossiers des collaborateurs des 5 dernières années. Y compris de ceux qui ont quitté la société.

Pour éviter que l’audit se transforme en quelque chose de légalement répréhensible, il va vous falloir mettre en place des actions pour éviter de saturer l’espace de stockage de vos sauvegardes, et vous permettre de garder les données les années nécessaires.

Pour cela, vous allez pouvoir jouer sur ces deux paramètres :

  • La durée de rétention, déjà. Il va s’agir de la durée maximale pendant laquelle vos sauvegardes seront conservées sur l’espace de stockage. Cette durée peut être fixe pour toutes les données, mais vous pouvez aussi imaginer avoir des durées de rétention différentes en fonction des données sauvegardées.

  • L’archivage des sauvegardes va intervenir au-delà de cette durée de rétention. Il s’agira de transférer les sauvegardes arrivant au bout de la durée de rétention sur un stockage à long terme, et de les enlever de l’espace de sauvegarde.

Avec une durée de rétention d’un mois, par exemple, vous n’arriveriez jamais à saturation de votre espace de stockage de sauvegarde.

Je peux aussi juste ajouter de l’espace, non ?

Oui, c’est une solution, mais qui n’est bonne qu'à court ou moyen terme. Car vous décaleriez le problème dans le temps.

L’archivage est en quelque sorte le moyen d’avoir des sauvegardes sur le moyen ou long terme. Elles sont moins fréquentes, mais restent nécessaires.

Cet archivage peut être fait sur un support plus adapté pour le stockage à long terme, comme des bandes magnétiques ou des espaces de stockage en ligne, ou même une baie de disques durs dans une salle séparée.

En combinant rétention et archivage, vous aurez donc des sauvegardes conservées sur le long terme en utilisant le moins d’espace possible, et cela répondra aussi bien aux besoins réglementaires qu'opérationnels de l’entreprise.

Gardez toujours en mémoire que les données ont potentiellement une obligation légale de conservation ; par exemple :

  • Santé : dossiers médicaux, radiographies, ordonnances.

  • Bancaire et Assurances : dossier clients, sinistres, crédits.

  • Militaire.

À vous de jouer

Contexte

Dernièrement, EthicalIT a eu l’opportunité de s’implanter à l’international en effectuant le rachat d’une ESN de Delhi, en Inde. En tant qu’entreprise éthique, EthicalIT fait aussi le choix d’exporter les valeurs de protection des salariés et de salaire dans sa nouvelle structure.

Les horaires de travail restent les mêmes en France comme en Inde, avec une plage de service de 8 h à 19 h. Le décalage horaire de 3 h 30 (en heure d’été) et 4 h 30 (en heure d’hiver) entre les deux agences permet de pouvoir planifier des créneaux de travail en commun.

Ce choix d’implantation, motivé par le désir d’avoir un pied dans le continent asiatique, va profondément modifier le fonctionnement de l’entreprise, et en particulier celui des sauvegardes.

Consignes

Actuellement, la fenêtre de sauvegarde d’EthicalIT est de :

Du lundi au jeudi, 21 h - 6 h.

Du vendredi 21 h au lundi 6 h.

  • Proposez une nouvelle fenêtre de sauvegarde, en prenant en compte le décalage horaire.

  • Proposez un type de sauvegarde permettant d’optimiser le fonctionnement sur deux sites géographiques distants.

  • Justifiez vos choix dans votre journal de bord téléchargeable à ce lien.

En résumé

  • Il y a trois méthodes principales de sauvegarde : 

    • Sauvegarde complète.

    • Sauvegarde incrémentale.

    • Sauvegarde différentielle.

  • Les méthodes de sauvegarde sont à utiliser en fonction de : 

    • l’impact sur le système informatique ;

    • la fréquence ;

    • la fenêtre de sauvegarde.

  • La sauvegarde synthétique permet de réduire la création des sauvegardes complètes en fusionnant les sauvegardes incrémentales avec la dernière complète pour limiter l’impact et respecter la fenêtre de sauvegarde.

  • Effectuer des copies de ses sauvegardes sur un stockage secondaire est aussi important que sauvegarder ses données.

  • Archiver ses données permet de :

    • conserver ses données au-delà de la rétention ;

    • respecter un cadre légal ;

    • respecter les objectifs de l’entreprise.

Les bases sont presque toutes posées, il faut maintenant aborder le stockage de nos sauvegardes en tant que tel.

Exemple de certificat de réussite
Exemple de certificat de réussite