> Tech > Voler aux instruments, environnements IBMi

Voler aux instruments, environnements IBMi

Tech - Par Renaud ROSSET - Publié le 17 mai 2011
email

Avec les composants réseau plug-and-play modernes, il est tout à fait possible de construire un réseau qui fonctionne de manière complètement invisible.

Voler aux instruments, environnements IBMi

Beaucoup d’entreprises commençant avec de petits réseaux se retrouvent avec des réseaux toujours plus grands, mais présentant des problèmes de performances intermittents et parfois des pannes totales. Il est presque impossible de dépanner ce genre de réseau sans le démanteler pour insérer des outils de diagnostic élaborés, du genre renifleurs de réseaux et générateurs de trafic.

Simple Network Management Protocol

Mieux vaut donc intégrer d’emblée la visibilité dans le réseau. Le principal outil de visibilité est le Simple Network Management Protocol (SNMP), qui permet à une Network Management Station (NMS) centralisée, ou console, de sonder tous les appareils du réseau pour obtenir des informations de santé et les présenter sous forme de tables et de graphiques.

Les outils SNMP enregistrent des tendances et permettent de détecter rapidement les problèmes du réseau, comme des unités en panne, un trafic élevé ou des taux d’erreurs excessifs. La plupart des consoles SNMP ont aussi des serveurs web intégrés, vous permettant d’accéder à leur contenu à partir de tout navigateur, y compris les navigateurs mobiles de smartphones comme l’iPhone d’Apple.

Pour utiliser SNMP, il faut des appareils de type SNMP, souvent appelés unités gérées. Il existe de nombreux routeurs, commutateurs et serveurs gérés par SNMP, mais ce ne sont pas les moins chers du marché. Cependant, le petit coût supplémentaire de SNMP se justifie largement dans un environnement d’entreprise. La plupart des systèmes d’exploitation serveur, y compris IBM i, ont un support SNMP intégré qu’il suffit d’activer. Une fois que les unités et serveurs de type SNMP sont en place, il est simple d’installer un NMS (Network Management System) et de commencer à collecter des statistiques utiles.

Le logiciel SNMP NMS fonctionne généralement sur un ordinateur de bureau ordinaire. SNMP n’est pas très lourd et convient à des PC classiques. Le logiciel NMS proprement dit peut être un produit du commerce, dans une gamme de prix allant de quelques centaines d’euros à plusieurs milliers, ou des packages de logiciels open source gratuits (FOSS, free open source software) tels que MRTG (mrtg.org), Nagios (nagios.org) et Cacti (cacti.net). Outre le traçage de courbes statistiques et la journalisation d’événements, la plupart des NMS incluent des sous-systèmes de notification qui alertent le personnel d’anomalies telles qu’une unité défaillante ou la congestion du réseau.

La configuration de SNMP pour en tirer des statistiques intéressantes demande réflexion et efforts. SNMP organise les statistiques en ensembles de données appelés MIB (Management Information Base). Un MIB générique épaulé par toutes les unités, collecte des statistiques sur les interfaces réseau, comme Ethernet, T1 et les ports optiques. Les valeurs les plus intéressantes à suivre sont les volumes de trafic et les débits de données, les temps de réponse des unités et des applications (appelés temps d’aller-retour), et les taux d’erreurs sur des interfaces critiques, comme les serveurs et les routeurs.

Les taux d’erreurs se divisent en deux catégories : les erreurs de total de contrôle (checksum) et les paquets abandonnés. Les premières, aussi appelées erreurs de réception, se produisent quand une unité détecte la corruption dans un paquet reçu, en calculant le total de contrôle et en obtenant une valeur différente de celle calculée par l’envoyeur du paquet. Des erreurs de total de contrôle occasionnelles sont normales, mais tout ce qui dépasse 1 % doit être analysé de près.

Les erreurs de paquets abandonnés, aussi appelées erreurs de transmission, se produisent quand une unité est incapable d’envoyer un paquet et doit le rejeter. C’est souvent dû à une congestion de la liaison : les paquets entrent dans une unité plus rapidement que la vitesse de transmission de la liaison sortante. Certes l’unité peut mettre quelques paquets en tampon, mais quand ces derniers sont pleins, les éventuels paquets supplémentaires doivent être rejetés ou abandonnés. Parfois, le fait de changer les allocations tampons de l’unité peut réduire le nombre de paquets abandonnés. D’autres fois, il s’agit simplement d’une capacité réseau insuffisante et seule son augmentation résoudra le problème.

SNMP a une catégorie spéciale de statistiques pour serveurs, appelée host resources MIB, qui suit des valeurs utiles comme l’usage des disques et de la mémoire, la charge de la CPU, et des mesures environnementales comme la température de la CPU et l’état du ventilateur. La surveillance de ces valeurs peut avertir de problèmes potentiellement graves (comme un lecteur de disques se remplissant). Parfois, des mesures cumulées sur plusieurs serveurs prédisent certains problèmes courants. Par exemple, une augmentation graduelle de la température de la CPU au fil des mois n’a probablement rien à voir avec le réchauffement climatique global mais plutôt avec des filtres d’aération sales.

Les pare-feu deviennent souvent des goulots d’étranglement du réseau, et SNMP peut en faciliter la détection avant qu’ils ne deviennent critiques. Par exemple, tout pare-feu contient une table de connexion qui limite le nombre de connexions utilisateurs simultanées à Internet. Un virus logé dans le LAN balayant Internet à la recherche de futures victimes cause souvent le débordement de cette table et donc la chute des performances Internet. Si vous configurez SNMP de manière à vous alerter quand la table de connexion est presque épuisée, vous aurez un indice de la présence d’un virus sur votre LAN.

Téléchargez cette ressource

Guide des Solutions Cloud & Services Managés Simplifiés

Guide des Solutions Cloud & Services Managés Simplifiés

Comment capitaliser sur son existant tout en bénéficiant, dès à présent, des promesses de flexibilité et de scalabilité du cloud ? Découvrez les bonnes pratiques pour répondre aux défis de simplification du Cloud dans ce nouveau TOP 5.

Tech - Par Renaud ROSSET - Publié le 17 mai 2011