Définissez une sauvegarde
Imaginez cette situation : vous êtes dans votre première mission d’administrateur système, de technicien informatique ou même d’analyste d’exploitation pour la société EthicalIT, une entreprise de service du numérique (ESN).
Félicitations, c’est toujours un départ stressant, mais très enrichissant.
Ce matin, vous ouvrez votre logiciel de gestion des demandes et incidents, et vous recevez la demande de Mickael, gestionnaire RH de votre société :
Bonjour, je viens vers vous car j’étais en train de travailler sur les dossiers de demande d’affiliation des nouveaux collaborateurs de la semaine à la mutuelle, et j’ai effacé par erreur tous les justificatifs des dossiers de tous les salariés.
J’ai un audit la semaine prochaine ! C’est un désastre ! Pouvez-vous m’aider ?
Ce genre de situation arrive malheureusement trop fréquemment. Aujourd’hui ce sont les justificatifs, demain ce pourrait être les modélisations 3D de la nouvelle éolienne marine que votre entreprise développe !
Si vous pensez stressant un démarrage de mission, imaginez maintenant devoir expliquer à Mickael que la dernière sauvegarde remonte à 3 mois !
C’est un peu exagéré comme exemple. Aujourd’hui toutes les entreprises ont des sauvegardes fiables… N’est-ce pas ?
Eh bien dans un monde parfait, oui. Mais malheureusement, encore aujourd’hui, le risque de perte de données est trop fréquent, pour des raisons très variées comme :
la fausse manipulation : une suppression accidentelle d’un fichier important, par exemple en faisant mal sa sélection multiple de fichiers, mais aussi le mauvais traitement démarré au mauvais moment… ;
le sabotage : un salarié inconscient ou malveillant qui décide de supprimer tout son travail au moment de partir, ou le vol et la suppression des données par une entité externe ;
les problèmes matériels : un disque dur défaillant ou la perte d’un serveur ;
le rançongiciel, ou ransomware : qui va insidieusement chiffrer vos données pour ensuite vous demander une rançon en échange d’un éventuel, et probablement faux, déblocage de la situation.
Maintenant que vous saisissez mieux toute l'étendue du risque, je vous propose de voir comment se prémunir de ces pertes de données en mettant en place des sauvegardes fiables et cohérentes.
D’accord pour apprendre comment protéger mes données en les sauvegardant, mais… c’est quoi une sauvegarde ?
Très bonne question que vous posez là.
Dans notre contexte, c'est-à-dire l’informatique, la sauvegarde c’est l’action qui permet de dupliquer une donnée, et ce, pour la mettre en sécurité dans le cas où une perte arriverait.
Chez nos voisins anglophones, vous verrez le terme de “backup”. Mais le même mot est utilisé pour parler de la donnée résultant de cette action de duplication : une sauvegarde.
La donnée peut être de plusieurs natures différentes.
Des fichiers simples, comme des textes ou des images.
Des fichiers de configuration, comme les configurations des commutateurs dans une infrastructure.
Des machines virtuelles, par exemple les serveurs déployés pour accueillir une application ou un service.
Tout autre type de donnée qui serait nécessaire au bon fonctionnement de l’entreprise.
Une fois cette donnée initiale sauvegardée (la source), si une situation venait à la supprimer ou la modifier, la donnée sauvegardée (le duplicata) pourrait être restaurée pour revenir à l’état initial. Il s’agit dans ce cas d’une restauration.
Donc lors de la sauvegarde, on fait une copie du fichier à sauvegarder dans un autre emplacement, et lors de la restauration, on fait une copie du fichier de cet autre emplacement ? C’est bien ça ?
C’est exactement ça ! Si vous avez compris ce principe, vous avez compris un élément clé qui vous permettra de mettre en place des sauvegardes fiables et sûres.
Dans notre situation, avouez que pouvoir répondre à Mickael ceci serait rassurant pour tout le monde :
Mickael : Bonjour, je viens vers vous car j’étais en train de travailler sur les dossiers de demande d’affiliation des nouveaux collaborateurs de la semaine à la mutuelle, et j’ai effacé par erreur tous les justificatifs des dossiers de tous les salariés.
C’est un désastre ! Pouvez-vous m’aider ?
Vous : Bonjour Mickael. Rassurez-vous, nos sauvegardes sont à jour, et je peux vous restaurer tous les justificatifs à la date d’hier soir !
Mickael : Merci beaucoup, je me voyais déjà devoir les redemander à tout le monde.
Comprenez le cycle de la sauvegarde
Comme beaucoup d'opérations informatiques, la sauvegarde va suivre un déroulement logique et séquentiel. C’est ce qui va permettre de faciliter l’automatisation des sauvegardes, de la restauration, mais aussi l’analyse en cas de dysfonctionnement.
Vous l’avez vu juste avant, l’opération de sauvegarde est une opération de duplication de la donnée.
Si vous deviez procéder à cette sauvegarde manuellement, il vous faudrait tous les jours, avant de partir du travail par exemple, venir prendre les fichiers et les copier vers leur destination de stockage. C’est long, fastidieux, ça demande beaucoup de temps, et ça multiplie les risques d’erreur.
Mais dans les (très) grandes lignes, ce sont les opérations à effectuer pour avoir des sauvegardes :
On copie la donnée de son emplacement initial.
On la colle sur le stockage de la sauvegarde.
On recommence jusqu’à ce que tous les fichiers soient sauvegardés !
Et pour la restauration, on procède de la même manière, mais en inversant l’emplacement de sauvegarde et l’emplacement initial.
En fonction de l’entreprise où vous serez, vous verrez plusieurs architectures de sauvegarde.
La sauvegarde directe : Il s’agit de l’exemple décrit juste avant. La sauvegarde directe est éventuellement adaptée à de petites structures ou une volumétrie faible. Elle peut faire appel à un script développé en interne ou avec l'outil de planification de sauvegarde de Windows, par exemple.
La sauvegarde par serveur : Cette sauvegarde est gérée et pilotée par un serveur tiers. Les données ne transitent plus directement de la source vers le stockage, mais passent par le serveur de sauvegarde. Il n’y a qu'un cloisonnement de l’espace de stockage de la sauvegarde, qui n’a plus que le serveur de stockage en point d’entrée.
La sauvegarde par proxy : Très proche de la solution de sauvegarde précédente, la sauvegarde par proxy va ajouter une série de serveurs proxy qui vont faire transiter les données, et feront aussi office de load balancer (ou répartiteur de charge, en français). Dans cette architecture, le serveur de sauvegarde va superviser le fonctionnement des différents proxys.
Je vous propose un petit résumé sous forme de tableau des différentes architectures, avec leur tolérance à la panne, leur sécurisation en n’étant pas directement liées à la source, ou encore leur capacité à pouvoir être adoptées par des grandes structures.
Le coût de mise en place et d’exploitation est aussi une information intéressante à prendre en compte.
Architecture | Tolérance à la panne | Liaison directe entre la source et le stockage | Adaptée aux grandes infrastructures | Mise en place |
Sauvegarde directe | Faible | Oui | Non | € |
Sauvegarde par serveur | Moyenne | Non | Moyennement | €€ |
Sauvegarde par proxy | Haute | Non | Oui | €€€ |
Maintenant que vous avez une meilleure idée de ce qu’est une sauvegarde, je vous propose d’en apprendre plus sur les éléments d’un plan de sauvegarde à prendre en compte.
Découvrez les éléments d’un plan de sauvegarde
D’accord. Donc, j’ai compris que sauvegarder, c’est déjà le premier pas. Mais est-ce que je dois tout sauvegarder de la même manière ?
Plutôt que vous dire oui ou non, je vais vous répondre par une autre question : Est-ce qu’en cas de demandes ou de tickets d’incident, vous les priorisez tous de la même manière ?
La réponse, vous l’aurez deviné, est non.
Rappelez-vous de Mickael, le gestionnaire RH de la société : pensez-vous que les justificatifs des différents dossiers des collaborateurs ont autant d’importance que les photos du dernier after work entre collègues ?
Non bien sûr. C’est évident que les soirées entre collègues sont moins critiques pour l’entreprise, mais comment j’estime le niveau d’importance des données ?
Vous mettez là le doigt sur un premier élément important : la criticité de la donnée.
Il ne s’agit pas du seul élément nécessaire à prendre en compte lorsque que vous allez devoir créer votre plan de sauvegarde. Un des facteurs importants de ce plan sera la fréquence d’exécution des sauvegardes.
Il va être important de réaliser vos backups au bon moment et à la bonne fréquence pour éviter de risquer de perdre plusieurs jours/semaines de travail de vos collaborateurs.
Ensuite, vous devrez choisir sur quel support sauvegarder vos données. Là aussi, le choix doit être réfléchi en fonction du temps de rétention de la donnée sauvegardée, ou de ce qui est déjà en place dans l’infrastructure.
Pour faire une bonne sauvegarde, fiable dans le temps et sur laquelle vous pouvez toujours compter, il vous faut sélectionner l’outil approprié. Ça peut être un script, développer en s’appuyant sur les commandes internes du système d’exploitation, ou même les outils de sauvegarde intégrés à l’OS, mais aussi des logiciels tiers spécialisés dans cette tâche.
Vous verrez plus tard que toutes les sauvegardes ne sont pas réalisées de la même façon. Certaines vont absolument tout copier, mais d’autres vont se contenter de ne sauvegarder que les modifications effectuées après chaque exécution. Ces sauvegardes sont dites incrémentales ou différentielles. Il sera nécessaire d’adopter les bonnes méthodes au bon moment.
Enfin, vos sauvegardes devront régulièrement être testées et approuvées. Vous devrez les contrôler via la mise en place de plans réguliers de vérification. En faisant et validant des restaurations, par exemple.
Votre plan de sauvegarde parfait devra donc comporter les éléments suivants :
la donnée à sauvegarder et sa criticité ;
la fréquence de sauvegarde ;
le support de stockage ;
l’outil adapté pour sauvegarder ;
une méthode de sauvegarde ;
les méthodes de contrôle des sauvegardes et leur planification.
Nous allons voir ces différents points pas à pas dans les chapitres suivants de ce cours.
En résumé
Il existe plusieurs raisons de risquer de perdre ses données. Il ne faut jamais pécher par excès de confiance.
Une sauvegarde consiste à faire une copie d’une donnée sur un autre support de stockage. Une restauration est l’inverse de la sauvegarde : on copie la sauvegarde sur son support d’accueil !
Les sauvegardes doivent toujours être adaptées à la donnée sauvegardée et à la structure de l’entreprise.
Des sauvegardes qui ne sont pas testées régulièrement ne peuvent pas être considérées comme fiables.
Maintenant que les principes sont vus, il est temps de rentrer plus en détail dans les différentes méthodes de sauvegarde !