Un plan de relève, plus nécéssaire que vous ne le pensez

Le quoi, comment et pourquoi d’un plan de relève après sinistre

 

Imaginez le scénario. C’est une superbe fin de semaine de juillet. Il fait 35 degrés dehors et on se rafraichit dans la piscine. Vous recevez un coup de fil du contremaitre de l’usine. Tout est en panne! Les systèmes informatiques ne fonctionnent plus, le téléphone non plus et plus d’internet.

Vous demandez à votre contremaitre d’aller à la salle des serveurs. lace et lorsque vous ouvrez la porte de votre salle de serveurs, une bouffé d’air chaud accompagne le silence! Voilà qui est inquiétant. Tous les systèmes se sont arrêtés parce que la température ambiante était trop élevée. Le pollen et la pollution a collé au condensateur du climatiseur ce qui l’a empêché de bien fonctionner.

Une fois la climatisation remise en marche, on commence à démarrer les systèmes un par un. Comme un malheur n’arrive jamais seul, une corruption rend l’ensemble de votre parc informatique non fonctionnel pour encore plusieurs heures, voir plusieurs jours.

Qu’allez vous dire aux clients qui attendent la livraison de leur commande demain matin?  

Vous avez la bonne idée d’enclencher votre plan de relève. En l’espace de quelques minutes, l’ensemble de vos serveurs sont démarrés dans le cloud. On restaure en priorité les systèmes les plus critiques pour la production de l’usine. La base de données et la production peut recommencer à fonctionner. Pendant les minutes qui suivent ce seront des systèmes moins critiques qui reviendront en ligne.

Généralement le plan de relève s’inscrit dans un cadre plus large qui couvre un arrêt des opérations de l’entreprise, les risques possibles, la vulnérabilité et les impacts d’affaires. Toutefois, une section spécifique devrait être consacrée aux TI. On couvre ici à très haut niveau ce que devrait contenir votre plan de relève.

        Liste des applications critiques et les systèmes associés qui supportent les applications

o   Méthode d’accès aux applications

o   Manufacturer et informations de contrats de support, contact

o   Dépendances des applications (Base de données, middleware, couche de présentation).

o   Le RPO et le RTO de chaque application

§  RPO : Recovery Point Objective : Posez-vous la question : combien de données suis-je prêt à perdre? 1 minute? 1 heure? 1 jour?

§  RTO : Recovery Time Objective : Combien de temps pouvez-vous vivre sans ces données.

§  Vos objects de RPO et RTO devraient définir votre politique de copie de sauvegarde.

o   Runbook des serveurs couverts par votre plan.

        Méthodologie de récupération des données

o   Système de sauvegarde utilisé

o   Procédure de récupération des données

o   Fréquence et politiques de sauvegarde

o   Emplacement des copies de sauvegarde hors ligne

        Informations sur le site de relève :

o   Dépendamment si votre site est à chaud ou en attente (Hot or Standby).

§  Un site à chaud (Hot Site) est un site ou des systèmes fonctionnent en même temps que votre site de production primaire. En règle générale les systèmes sont synchronisés entre les deux sites. Le principal avantage de ce modèle est la rapidité de reprise qui est à toutes fins pratiques instantanée, toutefois le cout d’exploitation se retrouve plus élevé.

§  Un site en attente (Standby) est un site ou des systèmes ne sont pas en fonction mais prêts à êtres démarrés et prendre la charge progressivement. Le principal avantage est son cout beaucoup moins élevé en échange d’un temps de recouvrement plus long.

o   Information pour y accéder

§  Accès à distance

§  Informations pour la livraison de médias (au besoin)

§  Contacts sur site (remote hands)

        Liste des contacts

o   Personnes et fournisseurs clés

o   Fournisseur internet

o   Fournisseur VPN / MPLS

 

Il est impératif de tester ce plan régulièrement. Il ne sera pas parfait au premier essai. Utilisez ces tests pour améliorer la performance du plan et apporter les changements nécessaires en production pour que le plan soit fonctionnel. Annotez les changements au plan à chaque essai. Annotez également le temps que vous avez mis à récupérer les applications sur votre site de relève afin de vous assurer que vos RPO et RTO sont synchronisés avec votre plan de sauvegarde et que votre plan tient la route.

Considérant que beaucoup d’opérations des entreprises modernes reposent sur les TI, il est impératif de protéger cet actif. La prévention reste encore et toujours le meilleur moyen de protéger vos atouts TI.

 

 

N’hésitez pas à nous contacter pour établir votre plan de relève TI.