Je reprends un post que j’ai publié sur le blog aucoeurdesinfras le 27 janvier 2015.
Jusqu’ici, tout va bien, pensez-vous.
« C’est l’histoire d’un homme qui tombe d’un immeuble de cinquante étages. Le mec, au fur et à mesure de sa chute se répète sans cesse pour se rassurer : jusqu’ici tout va bien, jusqu’ici tout va bien, jusqu’ici tout va bien.
Mais l’important n’est pas la chute, c’est l’atterrissage. »
Hubert Koundé, La Haine (1995), écrit par Mathieu Kassovitz
Vos affaires roulent, votre entreprise avance à grands pas et vous n’avez pas vraiment l’esprit à penser « catastrophe ».
D’autant que, comme tant d’autres entreprises, vous y avez déjà pensé avant, et vous avez mis en place un plan d’urgence.
Euh, vraiment ? Le rapport annuel DRbenchmark.org publié en 2014 a jeté un pavé dans la mare.
« Mauvaise nouvelle » annonce-t-il, « près de 3 compagnies sur 4 sont en danger, à défaut d’avoir bien réfléchi leur plan de reprise d’activité ».
Dans cette étude, près de 60 % des répondants n’ont en effet pas de plan de reprise d’activité documenté, et 40 % admettent que leur plan existant n’est pas très utile.
Plus de 65 % ne passent pas avec succès leurs propres tests, et sont incapables de produire un reporting détaillé en phase avec leurs besoins internes ou légaux. Ouch !
Télécharger le rapport DRBenchmark 2014.
Un constat que nous faisons nous-même sur le terrain : le strict minimum est là, avec un « pourvu que ça passe !» comme leitmotiv. A tort, bien évidemment.
Il ne s’agit plus de mettre en place un plan de reprise et de croiser les doigts ensuite, mais bel et bien de garantir un niveau de service acceptable en toute situation, et tout le temps.
Consultez le livre blanc de NetIQ : 5 choses à savoir pour préparer votre plan de reprise d’activité après sinistre
Un cruel manque de préparation
Evident ? Pourquoi, alors que le sujet du PRA n’est pas nouveau, en est-on encore là en 2015 ?
Parce que les entreprises font toujours face à un cruel manque de préparation, de documentation, de définition des métriques clés (RTO/RPO) et de mise en place de processus.
Ce travail approfondi, en somme, est nécessaire pour déterminer si l’entreprise peut survivre à une catastrophe majeure, ou survivre avec un minimum de dommages financiers ou de réputation.
La plupart du temps, cette préparation relève de la science inexacte, et fait peur aux entreprises. Mettre en œuvre un PRA est une chose, le faire fonctionner efficacement dans le monde réel en est une autre !
La virtualisation simplifie les choses
Pas de panique pourtant. Les meilleures pratiques, que nous mettons en œuvre au quotidien, et les technologies ad-hoc existent, et permettent de mettre en place une foultitude de tests en amont et à tous les niveaux, que ce soit pour les applications, le réseau et les données.
Des tests qui permettent de vérifier sa capacité à restaurer un environnement système, sa capacité à vérifier que la totalité des environnements étaient bien pris en charge, la capacité de savoir sauvegarder mais surtout de pouvoir TOUT restaurer. Véritable star de ces tests, la virtualisation permet aujourd’hui d’envisager des tests PRA très fréquents, à moindre frais et sans impact sur la production.
Non seulement elle élimine les problèmes associés à une restauration des environnements système sans système d’exploitation, mais il n’y a plus besoin de s’inquiéter de la compatibilité du matériel ou à passer par plusieurs étapes pour que votre serveur de test soit opérationnel. Cette gestion simplifiée permet aussi de sélectionner facilement les machines virtuelles que l’on veut tester, d’en créer des copies puis de les exécuter.
Rappel:
SLA de disponibilité | Heures de fonctionnement requises par an | Temps de hors service adminissible par an |
90 % (0,9) | 7 884 | 36,5 jours |
99 % (0,99) | 8 672 | 3,6 jours |
99,9 % (0,999) | 8 751 | 8,7 heures |
99,99 % (0,9999) | 8 759 | 52 minutes |
99,999 % (0,99999) | 8 760 | 5 minutes |