> Tech > Serveurs tolérants aux pannes

Serveurs tolérants aux pannes

Tech - Par Mark Weitz - Publié le 24 juin 2010
email

par Mark Weitz - Mis en ligne le 26/11/2003

La meilleure solution haute disponibilité ?

L'une des responsabilités d'un service informatique est d'éviter toute interruption des applications critiques. Bien que les produits en cluster offrent la haute disponibilité, le processus de failover peut perturber le traitement de l'application pendant 30 secondes ou plus. Selon le modèle de l'application client, les utilisateurs peuvent être obligés de se reconnecter à  l'application en cluster quand elle reprend sur le nouveau noeud...

L'une des responsabilités d'un service informatique est d'éviter toute interruption des applications critiques. Bien que les produits en cluster offrent la haute disponibilité, le processus de failover peut perturber le traitement de l'application pendant 30 secondes ou plus. Selon le modèle de l'application client, les utilisateurs peuvent être obligés de se reconnecter à  l'application en cluster quand elle reprend sur le nouveau noeud, et si le noeud défaillant se trouve sur un système distant, il faudra dépêcher un technicien pour le réparer. De plus, les clusters basés sur Windows 2000 Datacenter Server exigent une administration très poussée pour garder leur haut niveau de disponibilité.
Pour répondre à  certaines de ces préoccupations, plusieurs fournisseurs de serveurs ont mis au point des produits spécialisés. Marathon, NEC et Stratus ont présenté des solutions qui prétendent offrir une fiabilité matérielle de 99,99 % aux départements et aux entreprises petites et moyennes. Leurs solutions s'appuient davantage sur la tolérance aux pannes que sur le clustering et elles utilisent Win2K Advanced Server avec les versions standard de vos applications. Contrairement au clustering, où une défaillance du serveur arrête temporairement les applications tandis que le traitement de l'application se déplace sur un autre noeud, les systèmes tolérants aux pannes permettent aux applications de fonctionner sans interruption sur un sous-système redondant. Une fois les parties défaillantes remplacées, les noeuds en cluster et les systèmes tolérants aux pannes arrêtent temporairement le traitement. NEC et Stratus déclarent que la mise sous tension et la resynchronisation de la nouvelle partie (appelée réintégration dans les systèmes tolérants aux pannes) peut demander jusqu'à  12 secondes sous Win2K AS. Marathon déclare que ces temps de réintégrationsont de quelques secondes au plus. Par comparaison, la remise sur pied d'un cluster peut arrêter le traitement de l'application pendant 30 secondes ou plus.
Quand on compare le clustering et la tolérance aux pannes, il faut se souvenir que le service Microsoft Cluster traite des défaillances matérielles et logicielles, tandis que les systèmes tolérants aux pannes s'intéressent principalement à  la fiabilité du matériel. Bien que les techniques utilisées par NEC, Marathon et Stratus dans leurs architectures tolérantes aux pannes réduisent la probabilité d'une défaillance logicielle, s'il vous faut le haut niveau de fiabilité logicielle des services en cluster, vous devrez acheter des versions orientées cluster de vos applications, ce qui constituera une dépense supplémentaire.

Le système Endurance 6200 de
Marathon, que le Lab Windows & .NET
Magazine a testé (« Endurance 6200
3.0 », juillet 2001, http://www.itpro.fr
Club Abonnés), utilise quatre serveurs
qui apparaissent comme un même système
aux yeux de l’application et de
l’utilisateur. Deux serveurs fonctionnent
comme moteurs de calcul ; les
deux autres fonctionnent comme des
IOP (I/O Processors). Marathon sépare
l’environnement applicatif de la plupart
des drivers, isolant du même coup
l’application des défaillances provoquées
par le driver. Endurance est destiné
à  des applications qui tournent sur
des systèmes serveurs à  un ou deux
processeurs.

Les moteurs de calcul ont un ou
deux processeurs, de la mémoire, une
logique centrale, et un lecteur de
disque. Les IOP contiennent de une à 
quatre CPU, de la mémoire, des
contrôleurs de disque, du stockage et
des NIC. Les quatre serveurs sont
connectés et les NIC propriétaires de
Marathon fournissent un débit de 50
Mbps. Il faut configurer les moteurs de
calcul et les IOP de façon identique. Les moteurs de calcul sont accouplés
avec des processeurs I/O dans ce que
Marathon appelle des tuples. Les deux
moteurs de calcul exécutent les
mêmes applications à  l’unisson et stockent
les données sur leurs IOP respectifs.
Quand un incident arrête le traitement
sur une doublette, le traitement
se poursuit sans interruption sur
l’autre.

Quand le Lab a testé Endurance
6200 l’année dernière, le produit a
fonctionné impeccablement sans aucune
interruption des applications
quand nous avons provoqué des défaillances
matérielles. Il n’y a eu que de
courtes pauses quand nous avons réintégré
la doublette en panne. Dans nos
tests, l’interruption la plus longue du
traitement de l’application pendant la
réintégration n’a été que 4,5 secondes,
beaucoup plus courte qu’une interruption
pour « failback » de cluster.

Quand nous avons examiné
Endurance 6200, le seul moyen d’acquérir
le produit était d’acheter des
paires de serveurs configurés comme
le produit déjà  intégré, ce qui rendait
Endurance 6200 particulièrement coûteux,
sauf dans le cadre d’un plan
d’ajout de nouveaux serveurs.
Désormais, vous pouvez acheter le logiciel
et les MIC (Marathon Interface
Cards) comme un kit et mettre à  niveau
les serveurs existants pour environ
20 000 dollars (vous devez encore
utiliser des paires de serveurs configurés
de façon identique pour les moteurs
de calcul et les IOP). Endurance
6200 fonctionne sur Win2K Server,
Win2K AS, Windows NT Server et NT
Server, Enterprise Edition (NTS/E).

Marathon a annoncé récemment
une nouvelle mouture uniquement logicielle
du produit Endurance qui demandera
deux serveurs au lieu de
quatre. (Voir l’encadré « 2 serveurs valent
mieux que 4 ».) Avec le kit matériel
et logiciel Endurance actuel, votre application
n’a besoin que d’une licence.
Si vous achetez l’un des produits avec
une licence Win2K, il ne vous faudra
aussi qu’une licence pour l’OS. Si vous vous en tenez à  votre contrat de licence
en volume Win2K existant, c’est
la formulation de ce contrat qui déterminera
s’il vous faut ou non une seconde
licence OS. Le nouveau produit
(dont le nom n’a pas été arrêté) sera
disponible pour Win2K et supportera
Windows .NET Server (Win.NET
Server) 2003 peu après sa release.
Marathon n’envisage pas de prendre
en charge NT avec ce produit.

Téléchargez cette ressource

Cybersécurité des collectivités : Enjeux, Perspectives & Solutions

Cybersécurité des collectivités : Enjeux, Perspectives & Solutions

Villes, intercommunalités, métropoles, départements et régions sont particulièrement exposés aux risques de cybersécurité. Ce livre blanc Stormshield présente les défis cyber que rencontrent les collectivités, les solutions et perspectives pour qu’elles puissent assurer leur mission d’utilité publique, en toute sécurité.

Tech - Par Mark Weitz - Publié le 24 juin 2010