> Tech > Superviser ses problèmes de services Azure avec Service Health

Superviser ses problèmes de services Azure avec Service Health

Tech - Par Thierry Bollet - Publié le 22 avril 2020

Malgré toutes les précautions prises par le fournisseur de Cloud, il y a parfois des services qui ne sont plus pleinement fonctionnels. C’est un fait.

Superviser ses problèmes de services Azure avec Service Health

Du problème matériel qui peut impacter les clients aux événements exceptionnels et (presque) imprévisibles qui vont modifier de manière incontrôlées les charges d’un Datacenter. L’actualité récente (Covid-19) a montré que malgré le pilotage des charges et les actions de planifications, il n’est pas toujours possible de tout prévoir.

En témoignent les … 775 % d’augmentation de l’utilisation de Teams sur l’Italie

Parallèlement à cet événement, l’usage du Cloud Azure a très fortement augmenté sur cette même période et cet accroissement d’usage se poursuit depuis quelques semaines.
La question est donc de savoir comment s’informer sur l’évolution des services et éventuellement se préparer pour des événements de ce type.

Quelle surveillance mettre en place ?

Il existe une page de suivi dédiée pour l’état de santé des services Azure.

Etat de santé Azure

Il conviendra d’affiner les vues lors de la première utilisation. Par exemple, le filtre Région => Global n’est pas adapté pour un client qui héberge ses ressources sur la région France Center. Cette opération est importante, il faut aussi tenir compte des services pour lesquels une redondance a été sélectionnée. Comme un réplica de base de données sur une autre région. Ne sélectionner que France Centrale si les réplicas de bases sont hébergés sur Allemagne Nord ne garantit pas une vue exhaustive.

Sur cette page, 4 rubriques différentes :

  • Evènements actifs

ce sont les événements en cours de type informations, incidents mais également l’annonce de maintenances planifiées. Cette dernière catégorie est à surveiller tout particulièrement. Une maintenance planifiée est annoncée très à l’avance et permet d’engager actions ou communication si nécessaire. Toujours intéressant de ne pas consigner d’incident sur un service alors que celui-ci est dans un cycle de maintenance annoncée dans le portail depuis plusieurs semaines…

  • History

propose de remonter dans le temps et d’afficher les événements sur une période de 3 mois. A utiliser par exemple, pour des analyses poussées lors des diagnostiques (une application se plaint d’avoir eu des lenteurs il y a plusieurs semaines).

  • Resource Health

permet de créer un filtre de vue par subscription et par type de ressources. Pour une surveillance sur une portée plus réduite.

  • Alerts

est le réceptacle pour les alertes personnalisées créés par l’opérateur. Alertes est un service Azure qui permet de déclencher sous condition des mails ou autres actions. Ces informations sont normalement distribuées sur un scope restreint (1 équipe ou quelques personnes seulement) mais sont consolidés sur le portail pour créer une vue centrale.

Le service Alertes Azure

Téléchargez cette ressource

Guide de Threat Intelligence contextuelle

Guide de Threat Intelligence contextuelle

Ce guide facilitera l’adoption d’une Threat Intelligence - renseignement sur les cybermenaces, cyberintelligence - adaptée au "contexte", il fournit des indicateurs de performance clés (KPI) pour progresser d' une posture défensive vers une approche centrée sur l’anticipation stratégique

Les plus consultés sur iTPro.fr

A lire aussi sur le site

À la une de la chaîne Tech