WSP版WorkSpacesで作成したイメージ・バンドルでステータスが “UNHEALTHY” になったのでトラブルシューティングしてみた

2021.04.09

いわさです。

WorkSpacesのトラブルシューティングしてみました。
少し作業ログに近い形ですが、同様の問題が起きたかたの一助になればと思い記事に残すことにしました。

タイトルにWSP版と記載がありますが、WSPに起因する問題なのか不明です。
ただしPCoIPには無いWindowsサービスが立ち上がらない問題が起きていたので、PCoIP版で同じ手順を行った際には再現しなかったのでWSPと入れておいた次第です。

きっかけ

起動するとステータスがUNHEALTHYになります。

WorkSpacesクライアントからの接続は出来ません。
また、同様のバンドルから作成した環境はどのADユーザーでも問題が発生します。

トラブルシューティングの流れ

UNHEALTHY時のトラブルシューティングの流れは以下に記載があります。

  1. WorkSpaceの再起動
  2. 不具合のあるWorkSpaceへ接続
  3. リストア・リビルド

再起動は今回は効果がありませんでした。
WorkSpaceへの接続を行い原因のあたりをつけたうえで、イメージ作成元環境をリストアして設定変更のうえイメージを再作成することで最終的には事象が改善しました。

不具合のあるWorkSpaceへ接続

同一ネットワーク上に正常なWorkSpaceを起動し、今回はWindowsOSだったので、問題のある端末へRDP接続しました。
ここでRDP接続出来ない場合は再構築するしかないかなと思っていましたが、RDP接続には成功しました。

ちなみに、RDP接続するためにはWorkSpaces環境のセキュリティグループの変更が必要です。
プライベートIPアドレスからENIを調べて、対象セキュリティグループの設定を変更します。
以下を参考に設定しました。

セキュリティグループを変更し、RDP接続しました。

WorkSpacesクライアントから接続出来なくても、まずはリモートデスクトップ接続試してみましょう。

リモートデスクトップでのトラブルシューティング

上記手順に従って以下を確認していきます。

  1. CPU使用率の確認
  2. WorkSpaceのコンピュータ名を確認
  3. WorkSpacesサービスの確認
  4. ファイヤーウォールルールの確認

私の今回のケースでは1, 2, 4 は問題ありませんでした。
3で問題が起きていました。

上記リンクだと"SkyLightWorkspaceConfigService"と"Windows 用 PCoIP 標準エージェント"の2つのWindowsサービスが実行されている必要があります。
前者は起動されていましたが、後者はサービス自体登録されていませんでした。

ただし、正常なWorkSpace環境でもこのサービスは登録されていませんでした。
WSP環境では以下の"WSP service"というサービスが登録されています。

そして、UNHEALTHYな環境では"WSP service"が登録されていませんでした。
"C:¥Program Files¥Amazon¥WSP"にセットアップファイルが格納されていますが、実行しても失敗します。
どうやらWorkSpaceイメージの作成時or初期化時の実行が必要なようですが、何らかの理由で失敗していました。

PowerShell実行ポリシー

ImageCheckerはオールグリーンの状態だったので以下を確認しました。

WorkSpace の PowerShell 実行ポリシーは、RemoteSigned スクリプトを許可するように設定する必要があります。値を確認するには、Get-ExecutionPolicy PowerShell コマンドを実行します。Unrestricted または RemoteSigned に設定されていない場合は、Set-ExecutionPolicy –ExecutionPolicy RemoteSigned コマンドを実行して、実行ポリシーの値を変更します。この設定により、Amazon WorkSpaces でイメージの作成に必要なスクリプトを実行できます。

イメージ作成時にエラー(65%で止まり、1時間半程度でエラーになる)が起きていたのでRemoteSignedに変更したところ成功するようになりました。

バンドルから再構築

問題のあるイメージを作成した環境でも試してみました。
リストアし、PowerShell実行ポリシーを変更してイメージ展開を行ったところ成功するようになりました。

まとめ

実はUNHEALTHYと今回の問題がどう関連しているかまではまだ分析出来ていないので記事にすべきか少し迷いました。
ただ、どうにもならなくて困っているかたの解決のヒントになるかもしれないなーと思ったのでわかったところまででも記事にしておくことにしました。

  • WorkSpaceクライアントの接続やマネジメントコンソール上のヘルスチェックに失敗していてもリモートデスクトップでアクセスしてみよう
  • イメージチェッカーの検証が通っていてもイメージ作成の失敗原因は他にあるのでトラブルシューティングのページを参考に原因を潰していこう
  • WSP版でステータス:UNHEALTHYのときは、"WSP service" 起動されてるか確認しよう