【レポート】Windows on AWS – AWSサポートエンジニアによる技術サポート事例紹介 #AWSSummit

こんにちは、望月です。

2019/6/12(水)~14(金) の期間で開催されている AWS Summit Tokyo 2019 に参加しています!

本記事は「Windows on AWS - AWSサポートエンジニアによる技術サポート事例紹介」のレポートになります。

登壇者

  • アマゾン ウェブ サービス ジャパン株式会社
    • Premium Supportクラウドサポートエンジニア 小武 三博

Windows資産をAWSに移行するにあたり、サポートに不安をお持ちのお客様に向けて、AWS Premium Support の技術サポート事例の中から、Microsoftプロダクトに関連したトラブルシューティング事例をご紹介。AWSサポートのベストエフォートの考え方や、現実的にどこまでAWSサポートで調査を行うか、AWSとMicrosoft社がどのように協業してお客様の問題解決に寄与するかについて分かりやすく解説。

レポート

セッションの目的

  • Windowsのワークロードを持つお客様に具体的な事例を紹介することでAWSを安心してご利用いただく

セッションの目標

  • Microsoft製品もAWSサポートを信用してよさそう
  • Microsoftと連携してサポート

Agenda

  • Windows on AWS
  • AWSサポートについて
  • トラブルシューティング事例紹介
  • まとめ

Windows on AWS

  • AWSにおけるWindowsインスタンス
    • 継続的な環境整備を行い、顧客数も成長している

AWSサポートについて

  • サービス範囲
    • No Tech
    • Tech
    • 日本語ネイティブエンジニアによる 24/365 対応
  • 技術サポート
    • AWSの製品やサービスの開発時及び実運用時の問題
    • 多数のサードパーティー製アプリケーション
      • サードパーティー製ソフトウェアサポート
        • オペレーションシステム
        • インフラストラクチャコンポーネント
        • ウェブサーバ
        • データベース
      • ベストエフォートで最大限お手伝い
      • 対応が難しいもの
        • チューニング
        • カスタムコードのトラブルシューティング
        • セキュリティに関する質問
          • これらは直接ソフトウェアのプロバイダーへ
      • 不具合報告・調査依頼
      • 修正パッチの要求
        • 特定の条件を満たせばAWSからMicrosoftへ連携可能
          • 特定の条件
            • AWSサポートのBusiness/Enterpriseサポートプラン加入
            • License-Includedな正規のAMIを利用している
            • 対象Microsoft製品がMicrosoftの定めたサポート期限(EOS)内
    • Windowsサポートについて
      • 特定の条件を満たせば、AWSとMicrosoftが協力し、問題解決が可能
      • 条件を見たなさい場合も、サードパーティ製ソフトウェアサポートの対象となる可能性がある
      • BYOLの場合はお客様とMicrosoft間にサポート契約が必要

トラブルシューティング事例紹介

  • 事例1. Microsoftと協力して問題解決
    • Windows 2012 R2において、.NET Framework 3.5をインストールしようとすると失敗する
    • AWSサポートの調査
      • ドキュメンテーション調査
        • Microsoft Knowledge Base で問題で出力されたエラーコード内容を確認
        • Windows Updateのエンドポイントへ接続できないという内容だった
        • 一時的な回避策としてインストールメディアの利用を提示
      • メトリックス確認
      • 事象再現検証、事象再現条件の特定
      • Microsoftへエスカレーション
    • Microsoftと協力して調査
      • AMIに依存する問題かどうか切り分けを実施
        • 環境に依存せず、障害が発生することを確認
      • 調査を進めた結果、Microsoft側のネットワークで接続障害が発生していた
  • 事例2. AWSサポートのみによる問題解決
    • EC2 WindowsインスタンスからAmazon RDS DBインスタンス(SQL Server)へアクセスし遅延していたため、RDSのインスタンスタイプを上げたら、より遅延するようになった
    • AWSサポートの調査
      • ドキュメンテーション調査
      • メトリックス確認
        • 正常環境と事象が発生する環境を比較
          • Network
            • 問題なし
          • インスタンス
            • CPU、ネットワーク帯域も問題なし
          • Storage
            • EBSボリュームのレイテンシの影響はみられない
          • SQL Server
            • CPU、ディスクは問題なし
            • エンジンバージョンの違いはみられない
            • SQL文の実行計画には問題がみられない
      • パケットキャプチャより通信内容の解析
        • 正常環境と違い、DBインスタンスから返信されたTCPのACKが200ミリ秒遅延している
      • 事象再現検証、事象再現条件の特定
        • お客様より、事象再現をするスクリプトの提供を受ける
        • SQL Native Clientの別バージョンを試したところ、事象が解消
        • WinDBGを使い、SQL Native Clientを調査
          • WinDBG: Microsoftが無償で提供しているデバックツール
        • SQL Native Clientが異なるバージョンにより、Nagleアルゴリズムによるバッファリングが有効になり、バファリングに時間がかかり、小さな SQLクエリを対象に実行され、それが遅延につながった

まとめ

  • 多くのWindowsインスタンスがAWS上で稼働している
  • Windows及びTCPに精通したサポートエンジニアが在籍

最後に

多くのWindowsインスタンスがAWSで動いており、しっかりAWSとMicrosoftが連携しているため、安心して使えるという印象を受けました。

また、サポートを受ける側もAWSにサポートを投げて終わりではなく、AWSと協力し問題解決に動くことが早期解決につながるため、継続的に対応していくことが大事なことを再確認しました。