> Tech > Principe n° 3 : les opérations

Principe n° 3 : les opérations

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Des procédures opérationnelles défectueuses peuvent rendre inutile le meilleur matériel qui soit et la conception la plus minutieuse. La qualité d'une organisation est à  la hauteur de son chaînon le plus faible, et bien trop souvent on ne découvre ce chaînon qu'en cas de problème de fonctionnement.

Pour un

Principe n° 3 : les opérations

bon fonctionnement, l’essentiel est d’observer soigneusement les systèmes de production. Le système d’exploitation et Exchange Server écrivent des informations dans les journaux d’événements. Il faut donc, soit analyser les informations manuellement, soit utiliser un produit comme AppManager de NetIQ pour guetter les événements signalant des problèmes potentiels. Par exemple, si la Banque n’est pas absolument satisfaite de l’exécution intégrale, par le moteur de la base de données, d’une transaction dans une base de données, Exchange Server génère une erreur -1018 dans le journal Applications. Dans les versions antérieures à  Exchange Server 5.5, une erreur -1018 pouvait résulter d’un incident de synchronisation entre un contrôleur de disque et le système d’exploitation, mais Exchange Server 2000 et Exchange Server 5.5 contiennent le code pour réessayer les transactions et, par conséquent, maîtriser tout problème intermittent. Une erreur -1018 dans Exchange 2000 ou Exchange Server 5.5 peut signifier un incident matériel et l’altération de la base de données. Si vous ne contrôlez pas le matériel et que vous restaurez la base de données à  partir d’une sauvegarde, Exchange Server risque de générer d’autres d’erreurs -1018 au fur et à  mesure que la base de données s’altère et finit par tomber en panne. Bien entendu, toutes les sauvegardes effectuées pendant ce temps-là  contiennent des données altérées. L’utilitaire Eseutil peut corriger des altérations mineures, mais pas une perte de données fondamentales provoquée par une défaillance matérielle. Une erreur -1018 est, par conséquent, un événement sérieux. (Pour en savoir plus sur l’utilisation d’Eseutil, voir l’article de Paul
Robichaux, « The Sorcerer’s Apprentices » de mai 2000).

Bien d’autres événements quotidiens informent sur le bon fonctionnement d’un système Exchange Server. Par exemple, le journal Applications peut donner des informations sur la défragmentation en arrière-plan, une opération que la Banque effectue d’ordinaire automatiquement la nuit. Exchange Server consigne les événements qui signalent. le début d’un passage de défragmentation (événement 700), la fin du passage (événement 701) et la quantité d’espace libre existant dans la base de données après le passage (événement 1221).

L’événement que montre la Figure 3 fait état de 486 Mo d’espace libre (c’est-à -dire environ 7,2 pour cent de la base de données) après la défragmentation d’une banque de boîtes à  lettres Exchange 2000 de 6,67 Go. Exchange 2000 utilisera cet espace pour stocker de nouveaux messages et fichiers joints au fur et à  mesure de leur arrivée.

Bien que Eseutil permette d’effectuer une reconstitution hors ligne et de réduire l’encombrement de la base de données, il vaut mieux le faire seulement lorsqu’il s’agit de récupérer une quantité significative d’espace libre (c’est-à -dire plus de 30 pour cent de la base de données) et que l’on a besoin d’espace disque, ou bien s’il s’agit de réduire la durée des sauvegardes. Comme une reconstitution hors ligne empêche les utilisateurs d’accéder à  la messagerie et prend beaucoup de temps – au moins une heure pour 4 Go de données, plus le temps pour les sauvegardes avant et après la reconstitution – il vaut mieux acheter des disques supplémentaires ou envisager des systèmes de sauvegarde plus rapides que d’exécuter Eseutil.

C’est également dans le journal Applications qu’il faut chercher des signes d’erreurs MTA, des détails sur les messages de duplication entrants, et les cas d’utilisateurs connectés à  la boîte à  lettres d’un autre utilisateur au moyen d’un compte Windows 2000 ou Windows NT non associé à  cette boîte à  lettres. (Certains anti-virus provoquent ce dernier type d’événement lorsqu’ils se connectent à  des boîtes à  lettres pour surveiller les messages entrants pour tous les virus joints).

Exchange Server consigne aussi des événements liés aux sauvegardes. Les bons administrateurs système sont paranos sur les sauvegardes et s’assurent toujours de commencer, traiter toutes les données attendues et finir sans problème. Selon la Loi de Murphy, les bandes de sauvegarde s’avèrent toujours illisibles au pire moment et toutes les bandes de sauvegarde lisibles que l’on ressort lorsqu’on est sous pression contiennent toujours des données altérées.

Les sauvegardes sont la seule tâche très importante et fondamentale pour un administrateur Exchange Server. Tout le monde peut perdre la disponibilité d’un système à  cause d’un problème matériel, mais un patron pardonnera difficilement des temps d’arrêt prolongés du système ou la perte de données, lorsque des procédures incorrectes ou paresseuses entraînent la défaillance d’une sauvegarde. (Voir l’article de Jerry Cochran, « Exchange Server Backup Woes », http://www.win2000mag.com, InstantDoc ID 16542 pour se rafraîchir les idées sur les meilleures pratiques de sauvegarde).

La perte de la disponibilité d’un système est l’ultime défaillance en matière de performances. Il faut absolument réduire au maximum les effets négatifs de tout problème nécessitant la restauration de données. Le seul moyen de répondre à  cet objectif est d’observer scrupuleusement les règles suivantes :
– faites des sauvegardes quotidiennes et confirmez leur succès. La Figure 4 montre l’événement 213, écrit par Exchange Server dans le journal Applications à  la fin d’une sauvegarde réussie ;
– · sachez restaurer une base de données Exchange Server défaillante. Attention : dans Exchange 2000, cette tâche est à  la fois plus complexe et plus facile que dans Exchange Server 5.5. D’une part, Exchange Server Enterprise supporte plusieurs bases de données, il peut donc être nécessaire d’en restaurer plusieurs. D’autre part, la Banque d’Exchange 2000 peut continuer à  tourner pendant la restauration des bases de données, et le service n’est donc indisponible que pour les utilisateurs dont les boîtes à  lettres se trouvent sur les bases de données défaillantes. (Pour en savoir plus sur la restauration des boîtes à  lettres, voir les articles de Jerry Cochran « Repairing Your Exchange Server Databases », http://www.win2000mag.com, InstantDoc 8864, et « Detecting and Repairing Logical Corruption of Your Exchange Server Databases », http://www.win2000mag.com, InstantDoc 8906) ;
– sachez reconnaître les signes de défaillance imminente et surveiller la santé du système pour détecter les problèmes très tôt ;
– entraînez-vous à  un plan de récupération après incident. Assurez-vous que celui ou celle dont vous pourriez avoir besoin pour restaurer les données sait où trouver les supports de sauvegarde, comment restaurer à  la fois Exchange Server et le système d’exploitation (en cas d’une défaillance matérielle catastrophique), et quand il faut faire appel à  l’aide. Il n’est d’aucun secours d’appeler l’assistance des Services de support des produits Microsoft (PSS), si on a déjà  bousillé une sauvegarde. Si vous ne savez que faire, appelez d’abord le support technique. (Pour en savoir plus sur la récupération après incident, voir l’article de Paul Robichaux « Mitigating Disaster », de juillet 2000).

Les sauvegardes sont ennuyeuses et il peut être fastidieux de les effectuer correctement tous les jours que Dieu fait. Mais une bonne sauvegarde est inestimable en cas de défaillance d’un disque ou d’un contrôleur, et vous serez heureux (et rassuré quant à  l’avenir de votre job) de réussir une restauration remettant rapidement les utilisateurs en ligne.

Téléchargez cette ressource

Comment sécuriser une PME avec l’approche par les risques ?

Comment sécuriser une PME avec l’approche par les risques ?

Disposant de moyens financiers et humains contraints, les PME éprouvent des difficultés à mettre en place une véritable stratégie de cybersécurité. Opérateur de services et d’infrastructures, Naitways leur propose une approche pragmatique de sécurité « by design » en priorisant les risques auxquelles elles sont confrontées.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010