reprise sur incident - rmll 2011
DESCRIPTION
Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)TRANSCRIPT
RMLL 2011
Reprise sur incident
Qui suis-je ?
» Jean-Marc Fontaine
» Consultant pour Alter Way Consulting
» Président de l'AFUP
» Formateur / Professeur vacataire à l'université de Saint Quentin
» Co-auteur du livre blanc « Industrialisation PHP »
» Auteur du blog Industrialisation-PHP.com
Cela va arriver !Cela va arriver !
22/07/11 ALTER WAY - Reprise sur incident
Diminuer la gravité
» Durée d'indisponibilité
» Perte de données
» Rupture de la confidentialité
22/07/11 ALTER WAY - Reprise sur incident
Minimiser l'impact
» En terme d'image
» Financier
22/07/11
Se préparerSe préparer
22/07/11 ALTER WAY - Reprise sur incident
Avoir un plan
» Se préparer pour être efficace le jour J
» Equipe spécialisée
» Implication des fournisseurs
22/07/11 ALTER WAY - Reprise sur incident
Mesures de mitigation
» Machines virtuelles configurées
» Réplication de la base de données
» Désactivation de certaines fonctionnalités
» Version statique
22/07/11 ALTER WAY - Reprise sur incident
Sauvegardes
» Sauvegarder tout
» Sauvegarder régulièrement
» Garder un historique intelligent
22/07/11 ALTER WAY - Reprise sur incident
Journalisation (1/2)
» Système
» Application
» Déploiements
» Opérations de maintenance
22/07/11 ALTER WAY - Reprise sur incident
Journalisation (2/2)
» Privilégier les formats plats– Manipulation aisée– Signature– Compressibles– Gestion des droits aisées– Rotation
22/07/11 ALTER WAY - Reprise sur incident
Communiquer en interne
» Certains pics de fréquentations sont anticipables :– Période de l'année– Publicité– Promotion– Communication dans les médias
22/07/11 ALTER WAY - Reprise sur incident
Déploiement automatisé
» Rapide
» Pas sujet à la pression
» Outils :– Ant– Capistrano– Phing
22/07/11 ALTER WAY - Reprise sur incident
Tester les procédures
» Régulièrement
» Avec précaution
22/07/11
DétecterDétecter
22/07/11 ALTER WAY - Reprise sur incident
Supervision
» Ressources– Nagios– Centreon– Zabbix
» Journaux
» Application
» Disponibilité– Pingdom– NetVigie
22/07/11 ALTER WAY - Reprise sur incident
Facilitez le contact
» Personne / service à contacter identifiés
» Moyens de contact disponibles facilement
» Réactivité aux contacts entrants
22/07/11
CommuniquerCommuniquer
22/07/11 ALTER WAY - Reprise sur incident
Communication
» Isoler l'équipe d'intervention
» Escalader en interne si nécessaire
» Communication externe :– Régulière– Aussi transparente que possible– Page d'état
22/07/11
AnalyserAnalyser
22/07/11 ALTER WAY - Reprise sur incident
Identification de la cause
» Interne– Panne matérielle– Instabilité logicielle– Bogue applicatif– Erreur humaine
» Externe– Attaque– Panne matérielle– Pic de fréquentation
22/07/11 ALTER WAY - Reprise sur incident
Portée
» Quels sont les éléments touchés ?
» Le service est-il réduit ou coupé ?
22/07/11 ALTER WAY - Reprise sur incident
Impact
» Problème de sécurité ?
» Perte de données ?
» Atteinte à l'image ?
22/07/11
CorrigerCorriger
22/07/11 ALTER WAY - Reprise sur incident
Correction
» Activer les mesures de mitigation si nécessaire
» Appliquer les mesures correctives
» Déployer l'application si nécessaire
» En dernier recours tout couper
22/07/11
ApprendreApprendre
22/07/11 ALTER WAY - Reprise sur incident
Capitaliser
» Méthode des 5 pourquoi
» Intégrer le résultat aux procédures de test
22/07/11 ALTER WAY - Reprise sur incident
Récapitulatif
» Se préparer
» Communiquer
» Analyser
» Corriger
» Apprendre
22/07/11 ALTER WAY - Reprise sur incident
Merci !
» Email : [email protected]
» Twitter : jmfontaine
» Blog : www.jmfontaine.net
» Autre blog : www.industrialisation-php.net
22/07/11 ALTER WAY - Reprise sur incident
Crédits photos
» http://www.flickr.com/photos/r000pert/136999467/
» http://www.flickr.com/photos/illetirres/2214018398/
» http://www.flickr.com/photos/larimdame/2575986601/
» http://www.flickr.com/photos/techne/107093245/
» http://www.flickr.com/photos/p-doodle/466500483/
» http://www.flickr.com/photos/dennissylvesterhurd/141183312/