Storage Gateway 推奨アラームの対処法を教えてください

2023.07.13

困っていること

Storage Gateway S3 File Gateway の構築時に「推奨アラーム」を選択する予定です。
当該推奨項目でアラートが発生した場合の対処法を教えてください。

どう対応すればいいの?

はじめに、以下が 「推奨アラームの作成」より作成される CloudWatch アラームです。

例)

  • sgw-■■■■■■/CachePercentDirty
  • sgw-■■■■■■/FileSharesUnavailable
  • sgw-■■■■■■/IoWaitPercent

CachePercentDirty

ゲートウェイから Amazon S3 へのアップロードが遅くなっていることが考えられます。 ゲートウェイで使用できるインターネット帯域幅を増やすことをご検討ください。

ファイルゲートウェイを使用している場合は、CachePercentDirty メトリクスを確認します。ゲートウェイに書き込まれているデータが Amazon S3 には書き込まれていない場合は、ダーティとみなされます。CachePercentDirty メトリクスが 80% を超えていると、ゲートウェイから Amazon S3 へのアップロードが遅くなっていることが考えられます。

CachePercentDirty メトリクスが高い場合は、CloudBytesUploaded メトリクスをチェックして、Amazon S3 へのアップロード速度が遅いかどうかを確認します。アップロード速度が遅い場合は、ゲートウェイで使用できるインターネット帯域幅を増やすことを検討してください。

FileSharesUnavailable

ゲートウェイ上の使用不可状態にあるファイル共有の数を示しています。 考えられる原因には、ロール ポリシー エラーや、存在しない Amazon S3 バケットへのマッピングなどがあります。

UNAVAILABLE The file share is in an unhealthy state. Action is required. Some possible causes include role policy errors or mapping to an Amazon S3 bucket that doesn't exist. When the issue that caused the unhealthy state is resolved, the file share returns to a status of AVAILABLE.

弊社ブログを参考に、通信要件、セットアップ要件、ファイルゲートウェイが IAM ロールを引き受けることができているかなどをご確認ください。

IoWaitPercent

IoWaitPercent メトリクスが 10% を超えている場合は、ゲートウェイのディスクの I/O がワークロードを処理するのに十分ではない可能性があります。
キャッシュには、ローカルソリッドステートドライブ (SSD) ディスク (できれば NVM Express (NVMe)) の使用をご検討ください。
上記の対応ができない場合、ゲートウェイに別のキャッシュディスクをアタッチすると、ゲートウェイで使用できる I/O を増やすことも可能ですのでご検討ください。

If the CachePercentDirty metric is low, check the IoWaitPercent metric. If IoWaitPercent is greater than 10, your File Gateway might be bottlenecked by the speed of the local cache disk. We recommend local solid state drive (SSD) disks for your cache, preferably NVM Express (NVMe). If such disks aren't available, try using multiple cache disks from separate physical disks for a performance improvement.

参考資料