Vous pouvez vérifier l'état d'un volume Persistent Disk ou Google Cloud Hyperdisk en examinant la métrique état des performances du disque. Cette métrique indique si les performances du disque sont potentiellement affectées par des événements indésirables dans Compute Engine.
Un problème affectant l'état des performances du disque peut également être visible dans le tableau de bord Personal Service Health (PSH) de votre projet ou dans le tableau de bord Google Cloud Service Health.
Ce document traite de l'état des performances du disque et explique comment l'utiliser pour résoudre les problèmes de performances.
Quand vérifier l'état d'un disque ?
Si vous constatez un problème de performances avec un disque, vérifiez son état en examinant la métrique d'état des performances du disque. Cette métrique est mise à jour toutes les minutes et représente les performances du disque au cours de la minute précédente. Pour savoir comment vérifier l'état du disque, consultez Afficher l'état des performances du disque.
Le tableau suivant récapitule les valeurs possibles de l'état des performances du disque.
| État | Signification |
|---|---|
Healthy |
Les performances du disque sont conformes aux attentes. |
Degraded |
Vous pouvez observer temporairement une latence d'E/S plus élevée que prévu. |
Severely degraded |
Une latence d'E/S élevée ou d'autres erreurs se produisent. |
Si l'état des performances n'est pas Healthy, consultez Comprendre chaque état
pour connaître les étapes suivantes.
Si l'état des performances est Healthy, le disque fonctionne normalement et vous devez rechercher d'autres causes au problème de performances.
Vous devez vérifier si des erreurs se sont produites au niveau de l'application ou du système d'exploitation, et vous assurer que votre disque est correctement optimisé. Pour obtenir des conseils d'optimisation,
consultez Optimiser Hyperdisk
et Optimiser Persistent Disk.
Relation entre l'état du disque et les autres métriques de performances du disque
L'état du disque, tel qu'indiqué par la métrique d'état des performances, affiche l'
état interne du disque du point de vue de Google. Si l'état d'un disque est
Degraded ou Severely Degraded, la cause première se situe toujours dans l'infrastructure
Compute Engine.
En général, vous ne pouvez pas modifier l'état d'un disque en modifiant la charge de travail. Toutefois, dans de rares cas, une modification de la charge de travail peut déclencher un problème interne. Il est donc possible d'atténuer un problème en modifiant la charge de travail.
Pour en savoir plus sur les autres métriques de performances du disque disponibles, consultez Examiner les métriques de performances du disque.
Scénarios qui n'affectent pas l'état des performances du disque
L'état des performances du disque n'est pas lié aux problèmes de performances causés par les facteurs suivants :
- Optimisation incomplète ou insuffisante du disque
- Limite de performances associée au disque et au type de machine (si le type de machine choisi ne peut pas répondre aux exigences de performances de votre charge de travail)
- Augmentation de la charge sur le disque en raison du trafic de la charge de travail
- Erreur de l'utilisateur, de l'application ou du système d'exploitation
- Disques pleins ou corrompus
- Pour les volumes Hyperdisk et Extreme Persistent Disk, IOPS ou débit insuffisamment provisionnés.
Dans ces situations, il vous incombe d'améliorer les performances, par exemple en optimisant le disque, en augmentant la charge de travail, en modifiant le type de machine et en provisionnant davantage de capacité, d'IOPS ou de débit.
Afficher l'état d'un disque dans Cloud Monitoring
Pour afficher l'état d'un disque, créez un graphique dans l'explorateur de métriques.
Rôles et autorisations requis
Pour obtenir les autorisations nécessaires pour vérifier la métrique d'état des performances du disque, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :
-
Lecteur Monitoring (
roles/monitoring.viewer) -
Pour enregistrer un graphique dans un tableau de bord:
Éditeur Monitoring (
roles/monitoring.editor)
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.
Créer un graphique dans l'explorateur de métriques
Pour créer un graphique, créez une requête à l'aide de l'interface basée sur des menus ou PromQL.
Interface basée sur des menus
Pour afficher l'état d'un ou de plusieurs disques dans un graphique, procédez comme suit.
-
Dans la Google Cloud console, accédez à la leaderboard page Explorateur de métriques :
Accéder à l'Explorateur de métriques
Si vous utilisez la barre de recherche pour trouver cette page, sélectionnez le résultat dont le sous-titre est Monitoring.
- Dans la barre d'outils de la console Google Cloud , sélectionnez votre projet Google Cloud . Pour les configurations App Hub, sélectionnez le projet hôte App Hub ou le projet de gestion du dossier compatible avec les applications.
- Dans l'élément Métrique, développez le menu Sélectionner une métrique, saisissez
VM Instancedans la barre de filtres, puis utilisez les sous-menus pour sélectionner un type de ressource et des métriques spécifiques :- Dans le menu Ressources actives, sélectionnez Instance de VM.
- Dans le menu Catégories de métriques actives, sélectionnez Instance.
- Dans le menu Métriques actives, sélectionnez État des performances du disque.
- Cliquez sur Appliquer.
compute.googleapis.com/instance/disk/performance_status. Pour ajouter des filtres qui suppriment des séries temporelles des résultats de la requête, utilisez l'élément Filtre.
- Configurez le mode d'affichage des données.
Désactivez l'agrégation. Assurez-vous que dans l'élément Agrégation, le premier menu est défini sur Non agrégé et que le second est défini sur Aucune.
Pour afficher l'état d'un disque spécifique, filtrez pardevice_name.
Pour plus d'informations sur la configuration d'un graphique, consultez la page Sélectionner des métriques lors de l'utilisation de l'explorateur de métriques.
PromQL
Ouvrez l'éditeur de requête en suivant les étapes décrites dans Écrire des requêtes PromQL.
Saisissez votre requête dans l'Éditeur de requête. Par exemple, pour afficher l'état des performances d'un disque spécifique, saisissez la requête suivante :
last_over_time
(compute_googleapis_com:instance_disk_performance_status
{monitored_resource="gce_instance",
project_id ="PROJECT_ID",
device_name="DISK_NAME"}[${__interval}])
Remplacez DISK_NAME par le nom du disque, par exemple disk-1.
Si vous affichez les résultats dans un graphique, il y a trois lignes pour chaque disque, une pour chaque état possible. De même, si vous affichez le résultat de la requête dans un tableau, celui-ci comporte trois lignes pour chaque disque.
Si vous avez créé la requête avec PromQL, chaque ligne ou ligne aura la valeur 1 ou 0. Pour les requêtes créées avec les menus, les valeurs de
seront 100% ou 0.
L'état actuel du disque est représenté par la ligne ou la ligne dont la valeur est 100%
ou 1.
Par exemple, la capture d'écran suivante montre le graphique d'un disque nommé a-test-VM, dont l'état est Healthy :
Si vous affichez les résultats de la requête sous forme de tableau, le tableau suivant est un exemple des résultats pour un disque Healthy :
| performance_status | valeur |
|---|---|
Healthy |
1 |
Degraded |
0 |
Severely Degraded |
0 |
La capture d'écran suivante montre le graphique d'un disque appelé replica-23509, dont l'état est Degraded:
Pour en savoir plus sur la signification de chaque état des performances, consultez Comprendre chaque état. Une fois le graphique créé, vous pouvez l'enregistrer dans un tableau de bord pour une utilisation ultérieure.
Résultats fractionnaires
Si votre requête inclut des résultats fractionnaires comme dans le tableau suivant,
cela est généralement dû à la longue période d'affichage
sélectionnée. Par conséquent, Cloud Monitoring a agrégé les données au fil du temps.
Une valeur de 77% pour l'état Healthy signifie que l'état du disque était Healthy pendant 77 % de la période d'affichage sélectionnée.
| performance_status | valeur |
|---|---|
Healthy |
77% |
Degraded |
23% |
Severely Degraded |
0 |
Pour une vue plus précise de l'état d'un disque, utilisez une période d'affichage de quelques heures ou d'un certain nombre de minutes.
Comprendre chaque état
Cette section explique la signification de chaque état et quand vous devrez peut-être prendre d'autres mesures.
Healthy
L'état Healthy indique que, du point de vue de Google, le disque fonctionne normalement.
Si un disque Healthy présente des problèmes de performances, ne contactez pas l'assistance. Résolvez plutôt le problème du disque en suivant l'une des suggestions suivantes :
- Examinez les métriques de performances du disque, telles que la latence et la profondeur de la file d'attente.
- Recherchez les anomalies et les goulots d'étranglement dans les journaux et les métriques de votre charge de travail.
- Si vous utilisez un disque persistant, assurez-vous que la capacité provisionnée peut répondre aux besoins de performances du disque. Si vous utilisez des volumes Hyperdisk ou Extreme Persistent Disk, vérifiez que vous avez provisionné suffisamment d'IOPS et de débit.
- Assurez-vous d'avoir suivi les consignes pour optimiser le disque. Pour en savoir plus, consultez Optimiser Hyperdisk et Optimiser Persistent Disk.
Degraded
En général, vous n'avez pas besoin de contacter l'assistance si l'état de votre disque est Degraded. Un Degraded status est généralement dû à une maintenance interne normale
de l'infrastructure Compute Engine.
Vous ne remarquerez peut-être aucun impact sur les performances du disque lorsque son état est Degraded. Si le problème de performances et l'état Degraded sont corrélés dans le temps, le problème de performances peut toujours ne pas être lié à l'état Degraded.
Dans le cas peu probable où un problème de performances est dû à l'état Degraded, l'impact est généralement temporaire. L'état du disque doit revenir à Healthy en quelques minutes.
Vous pouvez ignorer l'état Degraded s'il n'y a aucun problème de performances avec le disque.
Que faire en cas de problème de performances ?
Si l'état des performances de votre disque est Degraded et que vous constatez un problème de performances, procédez comme suit :
- Consultez le tableau de bord PSH pour voir si un incident affecte le disque. Si c'est le cas, ne contactez pas l'assistance, car Google est au courant et travaille à résoudre le problème.
- S'il n'y a pas de problème connu, attendez au moins cinq minutes que le problème de performances se résolve de lui-même.
Si, après cinq minutes, le problème de performances n'est pas résolu et que l'état est toujours
Degraded, assurez-vous que le problème de performances n'est pas dû à une optimisation insuffisante du disque. Par exemple, vérifiez la latence et la profondeur de la file d'attente du disque. Il est possible que le problème de performances et l'étatDegradedne soient pas liés et ne soient que coïncidents. Pour ce faire, examinez les métriques du disque et les consignes d'optimisation des performances.Si les problèmes de performances persistent et que toutes les conditions suivantes sont remplies, vous pouvez contacter l'assistance pour obtenir de l'aide :
- L'état du disque est
Degradeddepuis plus de cinq minutes. - Vous êtes raisonnablement sûr qu'il ne s'agit pas d'un problème de charge de travail, car vous avez optimisé le disque et vérifié qu'il n'y avait pas d'autres problèmes, tels qu'un goulot d'étranglement ou une application surchargée.
- Aucune alerte n'est affichée dans le tableau de bord PSH.
- L'état du disque est
Google ne recommande pas de créer une alerte directement pour l'état Degraded, mais plutôt d'alerter sur l'état de l'application de niveau supérieur et d'utiliser cette métrique pour déboguer les problèmes.
Severely Degraded
Un disque dont l'état des performances est Severely Degraded présente un problème de performances. Ce problème peut être dû à un incident ou à une erreur, et peut
déjà être visible dans le tableau de bord PSH
ou dans le Google Cloud tableau de bord Service Health.
Que faire ?
Si l'état des performances de votre disque est Severely Degraded, procédez comme suit :
- Consultez le tableau de bord PSH et le tableau de bord d'état général Google Cloud pour voir si un incident affecte le disque. Si c'est le cas, ne contactez pas l'assistance, car Google est au courant et travaille à résoudre le problème.
- Si aucun problème connu n'est affiché dans les deux tableaux de bord, contactez l'assistance pour obtenir de l'aide.
Arbre de décision
Le schéma suivant illustre la procédure à suivre si un disque présente un problème de performances et récapitule les informations des sections précédentes.
Comme indiqué dans l'organigramme, vous ne devez contacter l'assistance que si aucune alerte connue n'est affichée dans les tableaux de bord PSH et Cloud Service, et que l'état du disque est Severely Degraded. Si le disque est Degraded, contactez l'assistance uniquement si toutes les conditions suivantes sont remplies :
- L'état du disque est
Degradeddepuis plus de cinq minutes. - Vous avez exclu une erreur ou une mauvaise configuration de la charge de travail (par exemple, des problèmes de réseau).
- Aucune optimisation supplémentaire ne peut être effectuée au niveau de l'application, de la charge de travail ou du disque.
- Vous avez examiné toutes les métriques du disque.
- Vous avez examiné les journaux de votre charge de travail et de votre machine virtuelle (VM).
Étape suivante
- Découvrez comment créer des graphiques avec l'explorateur de métriques et comment affiner les résultats de requête en ajoutant des filtres à un graphique.
- Recherchez les événements d'état du service actifs et passés dans le tableau de bord Personalized Service Health et dans Google Service Health.
- Pour obtenir des conseils d'optimisation des performances, consultez Optimiser Hyperdisk et Optimiser Persistent Disk.