Définissez la classification des données
Vous imaginez bien que, quand on parle de données, toutes ne sont pas aussi critiques les unes que les autres pour l’entreprise. Certaines d’entre elles sont même vitales et pourraient mettre celle-ci en danger en cas de perte.
D’un point de vue “macro”, la politique de sauvegarde va définir les stratégies de sauvegarde à appliquer en fonction de la criticité de la donnée. Et encore une fois, il incombe au gestionnaire de sauvegarde, qu’il soit administrateur Système ou technicien informatique, d’appliquer ces stratégies d’un point de vue “micro”.
Et dans cet audit, c’est aussi votre rôle de vérifier si la politique de sauvegarde est cohérente, et d’analyser quelle donnée est critique, et laquelle ne l’est pas.
Évaluer la criticité de la donnée n’est pas une science exacte, et il y a beaucoup de critères à prendre en compte.
Mais globalement, en se posant les questions suivantes, vous pourrez avoir des éléments de réponse :
Est-ce que ma donnée est nécessaire au bon fonctionnement de l’entreprise, voire à sa survie ? Par exemple, des résultats de recherche d’un laboratoire de biochimie sont critiques. Ou les modélisations 3D de l’éolienne en mer que votre start-up développe. Les perdre pourrait provoquer la perte d’années de travail et d’innovation.
Est-ce que ma donnée a une obligation légale ? Les pièces nécessaires à la comptabilité d’une entreprise ont un caractère légal, par exemple.
Est-ce que ma donnée peut être récupérée ou régénérée d’une autre manière ? Un serveur de recette, donc hors production, pourra être reconstruit à partir d’un autre environnement. Il est donc moins critique.
Ces exemples de questionnements peuvent aider à définir la criticité de la donnée et vont modifier votre façon de gérer sa sauvegarde.
Si j’ai bien compris, lorsque Mickael a perdu par accident des données qui ont un caractère légal, elles étaient de facto critiques. C’est bien ça ?
Exactement ! Vous l’avez compris. Après, ce n’est pas une science exacte, mais plus de la logique opérationnelle.
Une fois que vous aurez pu décider quelle donnée est critique et quelle donnée ne l’est pas, vous allez pouvoir réfléchir à des éléments plus pratiques, comme la fréquence de sauvegarde, la durée de l’archivage ou les délais de rétention.
La classification des données comprend aussi le volet de la confidentialité. Il faut prendre en compte que certaines données sont confidentielles, certaines seront restreintes à certains profils, d'autres strictement internes à l’entreprise, et enfin certaines seulement sont publiques. La politique de sauvegarde doit intégrer la façon dont chaque niveau de confidentialité est géré. Concrètement, ça peut être représenté par l’obligation de chiffrage de la sauvegarde.
Dans la politique de sauvegarde de l’entreprise où vous intervenez pour l’audit, vous constatez qu’il est bien prévu plusieurs niveaux de classification définissant les données comme étant :
Critiques : La donnée est vitale à l’entreprise. Elle doit avoir un temps de rétention de 2 mois, avec un archivage sur le long terme défini à 10 ans et avec une réplication distante. Une vérification de l’intégrité des sauvegardes et de la capacité de restauration est effectuée tous les trimestres.
Normales : La donnée permet le fonctionnement optimal de la société. Elle est sauvegardée quotidiennement, avec un temps de rétention d’un mois. L’archivage prévu est de 5 ans.
Faibles : La sauvegarde n’est pas nécessaire, les données sont volatiles ou régénérables rapidement.
Les différents niveaux de criticité (critique, normal ou faible, dans notre exemple) vont définir pour chaque donnée :
s’il est nécessaire de la sauvegarder ou non ;
la fréquence de sauvegarde ;
la rétention des sauvegardes ;
les archives à effectuer ;
le support de stockage ;
la sécurité à appliquer.
En reprenant l’exemple de l’application de comptabilité de Juliette, la collègue de Mickael au service comptabilité, on obtient le tableau suivant :
Niveau | Criticité | Impact de la perte | Effort de retour à la normale |
Critique | Maximale | Arrêt du fonctionnement de l’entreprise. Perte financière probable | Fort, contraignant et mobilise beaucoup de personnel |
Normal | Moyenne | Ralentissement du fonctionnement de l’entreprise ou de certaines entités. Perte financière possible, mais peu probable ou de faible valeur | Moyen |
Faible | Faible | Très faible, données volatiles. Pas de perte financière ou pertes anecdotiques | Faible |
En réalisant ce travail pour l’ensemble des données d’une entreprise, vous obtenez votre classification complète ! Vous connaîtrez l’importance de chaque donnée pour l’entreprise, et l’impact de sa perte.
Vous pourrez ensuite appliquer les stratégies de sauvegarde adéquates.
Paramétrez la fréquence des sauvegardes
Vous avez vu précédemment que dans la société où travaille Céline, la politique de sauvegarde a correctement défini la classification de la donnée.
Cette politique de sauvegarde va aussi préciser à quelle fréquence ces données devront être sauvegardées.
Ces informations vous donnent une première vision de ce que va être la planification des différentes sauvegardes.
J’avais cru comprendre qu’il fallait aussi avoir d’autres informations, comme la fenêtre de sauvegarde, pour pouvoir les planifier, nous n’en avons pas besoin au final ?
Vous avez totalement raison ! Pour pouvoir définir la planification et paramétrer nos fréquences de sauvegarde, vous devrez prendre en compte les fenêtres de sauvegarde disponibles, mais aussi les méthodes de sauvegarde (complètes, incrémentales ou différentielles).
Et toutes ces informations mises ensemble vont vous permettre de savoir assez précisément :
quoi sauvegarder ;
quand sauvegarder ;
comment sauvegarder ;
où sauvegarder.
Reprenons les informations que vous avez trouvées dans la politique de sauvegarde.
En tant que groupe semi-industriel, Coffecao ne travaille pas la nuit ni le week-end. Vous avez donc une fenêtre de sauvegarde disponible tous les jours de 21 h à 6 h du matin, par exemple, et en prenant un peu de marge. Et tous les week-ends en plus !
Vous pouvez imaginer une planification comme celle-ci :
1 sauvegarde complète par semaine, en général le week-end ;
5 sauvegardes incrémentales pour le reste de la semaine.
Vous pouvez aussi mettre en œuvre les sauvegardes synthétiques afin de reporter l’impact sur le stockage de sauvegarde à la place du stockage de production.
Dans la majorité des entreprises, le week-end est la fenêtre la plus grande disponible.
Chaque entreprise ayant des contraintes différentes et chaque donnée ayant sa propre classification, il faudra adapter votre planification en conséquence.
Gardez toujours en tête l’impact d’une sauvegarde sur la production et la fenêtre de sauvegarde lorsque vous planifiez vos sauvegardes.
Déterminez la durée de rétention des sauvegardes
Autant la politique de sauvegarde de Coffecao est plutôt claire en matière de classification des données, autant rien ne précise combien de temps celles-ci doivent être disponibles. Cette partie n’est pas à prendre à la légère et conditionnera la vitesse de restauration d’une donnée ou d’un environnement.
Nous avons défini ensemble qu’il y avait 3 niveaux de classification de la donnée : critique, normal et faible.
Vous avez aussi vu précédemment que vous pouviez réaliser 1 sauvegarde complète par semaine, et 5 sauvegardes incrémentales.
Bien qu’il n’y ait pas forcément un volume extrêmement important de données chez Coffecao, vous savez qu’il arrivera un moment où l’espace de stockage des sauvegardes commencera à être un peu trop étroit.
D’accord, je fais comment dans ce cas pour ne pas saturer mon stockage ?
Eh bien, c'est là que les deux notions suivantes vont prendre toute leur importance :
le délai de rétention ;
l’archivage de la donnée.
Le délai de rétention, d’abord. Celui-ci va correspondre au temps où la donnée sauvegardée sera disponible sur le serveur de stockage. Là encore, il va dépendre directement de la classification.
Concrètement, pour les données de conformité d’hygiène des produits transformés de Coffecao, qui sont critiques, le plan de sauvegarde pourra se référer aux informations suivantes de la politique de sauvegarde :
Fréquence de sauvegarde :
chaque jour.
Méthode de sauvegarde :
1 sauvegarde complète par semaine ;
5 sauvegardes incrémentales par semaine.
Fenêtre de sauvegarde :
21 h - 6 h + week end.
Rétention : 30 jours.
Le sujet qui nous intéresse particulièrement est la rétention : pour une donnée critique ou particulièrement sensible, il serait peut-être particulièrement judicieux de pouvoir y accéder pendant 1 mois, pour être en capacité de la restaurer dans les meilleurs délais.
Vous allez pouvoir ajouter toutes ces informations dans la politique de sauvegarde de Coffecao.
Je vous propose un premier récapitulatif de ce qui peut être retrouvé dans la politique de sauvegarde en fonction de la criticité.
Criticité | Fréquence | Fenêtre | Rétention |
Critique | Quotidienne | 21 h - 6 h + week-end | 30 jours |
Moyen | Quotidienne | 21 h - 6 h + week-end | 15 jours |
Faible | Hebdomadaire | 21 h - 6 h + week-end | 7 jours |
Et après le délai de rétention, ma donnée disparaît ?
Non, l’objectif n’est pas de perdre la donnée, mais bien au contraire de la garder. Au-delà de ces délais, l’archivage de la donnée sera réalisé. Et là encore, il y a des réflexions à avoir sur ce sujet.
Familiarisez-vous avec l’archivage long terme
La problématique de l’archivage est celle du stockage à long terme. Pour la rétention, nous étions dans une logique d’accéder au plus vite à la donnée sauvegardée pour optimiser le temps de restauration et avoir plusieurs versions de la donnée disponibles. Pour l’archivage, la capacité à restaurer la donnée rapidement n’est plus le critère principal.
Il faut maintenant s’assurer que notre donnée soit bien au chaud, et pour longtemps !
On ne pourrait pas se contenter de tout archiver sur bande magnétique, ou sur cloud, tout le temps ?
On pourrait, on pourrait, mais on créerait un problème de taille ! Ou plutôt, devrais-je dire, un problème d’espace.
En fait, la problématique de garder toutes les sauvegardes sur le stockage, ou de garder toutes les archives est la même. Arrivé à un moment, l’espace disponible se fait de plus en plus rare, jusqu’à disparaître…
Et accessoirement, l’archivage sur cloud coûte cher, et varie en fonction de la volumétrie utilisée.
Vous allez donc pouvoir commencer à appréhender comment mettre en place une politique de sauvegarde avec la gestion de l’archivage à long terme.
Bien qu’elles puissent tout de même arriver, les probabilités de demandes de restauration diminuent avec le temps. Et donc, vous n’avez pas besoin de conserver absolument toutes les archives en permanence.
Vous allez ainsi pouvoir mettre en place un système de rotation des sauvegardes. Ce système, vous le rencontrerez aussi sous le nom de “système GFS”, pour Grand-father, Father, Son, ou en français “grand-père, père, fils”.
Voilà en quoi cela consiste :
Lorsque la durée de rétention est atteinte, l’outil de sauvegarde supprime les sauvegardes quotidiennes incrémentales pour ne conserver que les sauvegardes complètes : ce seront vos sauvegardes hebdomadaires.
Niveau : Fils.Pour ces sauvegardes hebdomadaires, la politique va définir leur rétention.
Lorsque la rétention est atteinte, l’outil de sauvegarde supprimera les sauvegardes hebdomadaires pour n’en conserver qu’une : ce seront vos sauvegardes mensuelles !
Niveau : Père.Pour créer les sauvegardes trimestrielles, on ne conservera qu’une sauvegarde mensuelle lorsque sa durée de rétention sera dépassée.
Niveau : Grand-père.
Criticité | Fréquence | Fenêtre | Rétention | Archivage à long terme |
Critique | Quotidienne | 21 h - 6 h | 30 jours | Mensuelle, trimestrielle et annuelle |
Moyen | Quotidienne | 21 h - 6 h | 15 jours | Mensuelle |
Faible | Hebdomadaire | 21 h - 6 h | 7 jours | Pas d’archivage |
Avec ce système, vous ne gardez que certaines sauvegardes.
Vous constaterez que :
plus les sauvegardes sont récentes, plus vous en aurez ;
plus vous vous éloignez dans le temps, moins vous aurez de sauvegardes.
Les Fils (quotidiennes) deviennent donc des Pères (hebdomadaires) et les Pères deviennent des Grand-Pères (mensuelles, trimestrielles ou annuelles) au fur et à mesure des expirations des rétentions !
Coffecao n’aurait pas une sauvegarde complète par semaine, toutes les semaines, à archiver, soit 52 archives par an, mais par exemple :
4 sauvegardes hebdomadaires (4 semaines dans 1 mois), qui restent sur le serveur de stockage des sauvegardes ;
3 mensuelles (3 mois dans 1 trimestre), sur le support d’archivage ;
4 trimestrielles (4 trimestres dans 1 an), sur le support d’archivage ;
1 annuelle, sur le support d’archivage.
Soit un total 12 sauvegardes ! Vous avouerez que c’est plus simple à gérer au niveau des supports d’archivage.
À vous de jouer
Contexte
Après votre travail sur la politique de sauvegarde de Coffecao, EthicalIT vous demande de retravailler leur politique de sauvegarde. Votre DSI souhaiterait vous impliquer, en tant qu’expert, dans la rédaction de celle-ci.
C’est une réelle opportunité pour vous de pouvoir participer à la conception de ce plan de sauvegarde.
À partir de l’arborescence du serveur de fichiers, il va vous falloir analyser le type de donnée présente, et pour chaque type préciser la criticité de la donnée et proposer une fréquence de sauvegarde et une durée de rétention en fonction du niveau de criticité.
Arborescence des fichiers
Documents
Bilans
bilan_2023.xlsx (520 KB)
bilan_2022.xlsx (500 KB)
bilan_2021.xlsx (450 KB)
Factures
facture_001.pdf (300 KB)
facture_002.pdf (250 KB)
Contrats
contrat_JD.pdf (200 KB)
contrat_SG.pdf (200 KB)
contrat_BM.pdf (200 KB)
contrat_MD.pdf (200 KB)
CV anciens candidats
cv_Charlotte_L.pdf (150 KB)
cv_François_D.pdf (120 KB)
cv_Emilie_H.pdf (150 KB)
cv_Vincent_K.pdf (120 KB)
Projet A
rapport_final.docx (700 KB)
presentation.pptx (550 KB)
Projet B
rapport_final.docx (650 KB)
budget.xls (400 KB)
Comptabilité
Ressources humaines
Projets potentiels
Développement
Application 1
main.py (50 KB)
modules
Application 2
index.html (30 KB)
scripts
API
api_v1.md (20 KB)
api_v2.md (25 KB)
Guides
installation.pdf (40 KB)
configuration.txt (15 KB)
Jeux de données
Documentation
Marketing
Campagne Printemps
plan_marketing.pdf (120 KB)
visuels
Campagne Été
EthicalIT_été1.mpg (192 MB)
EthicalIT_été2.mpg (252 MB)
EthicalIT_été3.mpg (240 MB)
bilan_campagne.doc (90 KB)
vidéos
Images
logo.png (15 KB)
banniere.jpg (25 KB)
Vidéos
publicite.mp4 (80 MB)
interview.mp4 (120 MB)
Campagnes
Médias
Support technique
Logiciels
faq_software.txt (12 KB)
Matériel
faq_hardware.txt (15 KB)
Documentations / FAQ
Partage
documents_publics
public_file_1.txt (3 KB)
public_file_2.pdf (50 KB)
Finance
rapport_trimestriel.pdf (180 KB)
rapport_annuel.pdf (250 KB)
budget_2023.xlsx (300 KB)
budget_2022.xlsx (280 KB)
Rapports
Budgets
Archives
vieux_projet_1
old_code.java (40 KB)
old_docs
vieux_projet_2
ancient_code.py (30 KB)
ancient_docs
campagne_2019
report.doc (75 KB)
images
documents_campagne
bilan_financier.xls (200 KB)
videos
Anciens projets
Anciennes campagnes
Public
Privé
Consignes
En premier lieu, analysez les données à partir des noms, et déduisez si la donnée est critique, moyenne ou faible.
Pour chaque niveau de criticité, proposez et justifiez une fréquence de sauvegarde.
Donnez et justifiez une durée de rétention pour tous les niveaux de criticité.
En résumé
La classification des données permet de définir le niveau de criticité des données.
Elle est effectuée par le DSI, le service de sécurité informatique et les équipes métiers.
La politique définit la stratégie de sauvegarde à appliquer à chaque niveau de criticité.
La politique et la classification définissent également la fréquence, la rétention et l’archivage.
L’archivage à long terme permet d’économiser de l’espace de stockage au fur et à mesure que les sauvegardes vieillissent, en ne conservant que certaines sauvegardes pour chaque intervalle de durée (hebdomadaire, mensuel, annuel).
OK, ça prend forme ! Voyons quel espace peuvent nécessiter les sauvegardes dans le prochain chapitre.