Dans la gestion de la disponibilité, l’objectif est de s’assurer qu’une panne impacte le moins possible, voire pas du tout, la qualité du service. Dans le cas de la continuité de service, il n’est plus question, là, de se prémunir d’une panne touchant un ou plusieurs composants qui seront plus ou moins redondants. Il n’est pas question non plus de fiabiliser un service entier ou une chaîne de liaison complète. Dans la gestion de la continuité, on parle de gérer un désastre, c’est-à-dire l’arrêt, le blocage, l’altération ou la destruction complète du système d’information ou même du site hébergeant l’entreprise.
Pour cela, elle doit garantir que les moyens techniques et les services nécessaires peuvent être repris dans les délais requis et convenus. Il est donc indispensable de maintenir en permanence l’aptitude de reprise pour les services informatiques et leurs composants.
En conséquence, les activités de ce processus seront orientées sur des considérations pour certaines techniques, mais avant tout organisationnelles. En tant que processus de planification, elles permettront de proposer des évolutions de l’infrastructure et de l’organisation à mettre en place dans l’entreprise. Ces évolutions doivent évidemment être évaluées par la gestion des changements.
Ces activités sont :
initialiser la démarche de gestion de la continuité, en particulier obtenir le soutien et la bonne compréhension de la direction qui doit prendre ce sujet en main ;
estimer les conséquences possibles sur les métiers du dysfonctionnement ou de la disparition (temporaire) du système d’information, en réalisant régulièrement des analyses d’impact sur le business (BIA) ;
identifier les systèmes critiques et les priorités « métier » de leur restauration en cas de désastre, en effectuant régulièrement des analyses des risques et de la gestion des risques (la même que celle initiée par la gestion de la sécurité) ;
déterminer des mesures préventives et correctives des désastres pouvant affecter les systèmes IT, en assurant que les mécanismes de continuité et de reprise ont été mis en place, en évaluant l’impact des changements, en garantissant que des mesures proactives sont mises en place pour améliorer la disponibilité des services, et en négociant les contrats avec les fournisseurs pour la fourniture nécessaire aux plans de continuité (UC) ;
créer, tester et maintenir à jour le plan de reprise d’activité.
Identifiez et évaluez les impacts métiers
Les risques sont multiples et concernent des domaines très variés. L’analyse de risque débute par une identification des menaces. Elles peuvent être d’origine humaine (attaque délibérée ou maladresse) ou d’origine « naturelle » ; elles peuvent être internes à l’entreprise ou externes.
C’est lors de l’analyse de risque que peuvent être étudiés les différents scénarios de désastre. Elle permet de déterminer les impacts potentiels qu’aurait l’un de ces risques s’il venait à se produire.
L’impact peut concerner une perte financière, une atteinte à la réputation ou une infraction à la législation…
Le résultat principal de l’analyse d’impact est une donnée temporelle : c’est la durée maximale admissible d’une interruption de chaque processus de l’entreprise.
En tenant compte des actifs et des composants informatiques (réseaux, serveurs, applications...) dont chaque service dépend, on peut en déduire le temps maximal d’indisponibilité de chacune de ces ressources ; en d’autres termes, la durée maximale après laquelle une ressource informatique doit avoir été remise en fonction. On peut ainsi déterminer les délais au-delà desquels l’absence de service remet en cause la survie de l’entreprise. On définit ainsi le RTO (Recovery Time Objective).
Par ailleurs, il est important de prendre en compte la perte maximale d’information que l’on peut supporter suite à un désastre. En effet, plus le délai qui s’est écoulé depuis la dernière sauvegarde de données est important, plus les pertes seront grandes ou, dans le meilleur des cas, demanderont une nouvelle saisie des données. Dans ce cas, on parle de RPO (Recovery Point Objective).
De ces informations découle une évaluation des solutions envisageables (techniques et organisationnelles…). En effet, les solutions pour réduire le RTO, c’est-à-dire relancer le service le plus vite possible, ne sont pas les mêmes que celles pour réduire le RPO, c’est-à-dire réduire le délai entre deux sauvegardes.
Proposez la mise en place d'une organisation appropriée
La création et la mise en place d’un plan de reprise d’activité implique la mise en œuvre d’une organisation spécifique qui sera en charge de la gestion du sinistre, s’il se produit. C’est en partie pour cette raison que la direction de l’entreprise doit être associée le plus rapidement possible à la production du plan.
En effet, il est important de formaliser les processus de gouvernance, de prise de décision qui seront mis en place. Il faut décider la façon dont une cellule de crise sera organisée et la composition et le rôle des "équipes de pilotage du plan de reprise".
Ces équipes se situent à différents niveaux de hiérarchie :
les dirigeants qui ont autorité pour engager des dépenses ;
le porte-parole en charge des contacts avec les tiers : la presse, les clients et les fournisseurs, etc. ;
au niveau tactique, les responsables qui coordonnent les actions ;
au niveau opérationnel, les personnes de terrain qui travaillent sur le site sinistré et sur le site de remplacement.
Rédigez un plan de reprise d'activité
La rédaction du plan de reprise d’activité est en réalité l’occasion de rédiger plusieurs documents qui concernent des domaines spécifiques.
En fonction de l’activité ou de la culture de l’entreprise, on peut trouver des documents qui traitent de sujets techniques, organisationnels, juridiques.
Les plans doivent être des documents contrôlés pour assurer que seules les dernières versions sont en circulation, et que chaque destinataire en conserve un exemplaire personnel hors site. Le plan doit garantir que le détail de la reprise des services à la suite d’un sinistre est documenté. Les informations doivent être suffisantes pour permettre à une personne technique, non familiarisée avec les systèmes, d’être capable de suivre les procédures.
Testez et améliorez le plan
Le plan doit être régulièrement testé au cours d’exercices. Un exercice peut être une simple revue des procédures, éventuellement un jeu de rôles entre les équipes de pilotage. Un exercice peut aussi être mené en grandeur réelle, mais peut se limiter à la reprise d’une ressource (ex. : un simple service, une salle machine, un type d’équipement), ou à une seule fonction du plan (par exemple, la cellule de crise).
Le but de l’exercice est multiple :
vérifier que les procédures permettent d'assurer la continuité ;
vérifier que le plan est complet et réalisable ;
maintenir un niveau de compétence suffisant parmi les équipes de pilotage ;
évaluer la résistance au stress des équipes de pilotage.
En résumé
La gestion de la continuité de service est un processus de planification et de conception.
L’objectif principal est de fournir un plan et une organisation permettant la reprise la plus rapide possible de l’activité après un désastre.
L’analyse de risque permet d’anticiper sur les situations de sinistre et leurs conséquences sur les métiers.
Le plan présente les scénarios de reprise de l’activité et les étapes à mettre en œuvre.
Il est indispensable de tester le plan régulièrement.
Le personnel doit être formé à l'exécution du plan.