AWS ParallelCluster Manager へログイン時に Internal Server Error が出力されたときの原因と対処方法

2022.10.06

AWS ParallelCluster Manager へログイン時にログイン画面が表示されず、Internal Server Errorが表示されたときの原因と対象方法を紹介します。

AWS ParallelCluster Manager の URL を開くとブラウザに以下のメッセージが出力

期待しているログイン画面

原因と対処

原因

AWS ParallelCluster Manager へ長期間(一週間以上)ログインしていない状態で、ひさびさにログインしようとするInternal Server Errorの出力を確認しています。

対処

3分ほど放置してからログインし直せば自然回復します。

検証環境

ParallelCluster API Version 3.2.0 でデプロイした AWS ParallelCluster Manager 環境です。

Internal Server Error

AWS ParallelCluster Manager のログイン URL を開きます。すると、ブラウザ上の表示が以下の様になるときがあります。

エラーメッセージ

{"message":"Internal Server Error"}

ブラウザを更新すると、いつものログイン画面が表示されると思います。表示されないときは3分ほど置いてから更新してみてください。

ログインできても、今度は大量のエラーメッセージが出力されることもあります。ブラウザを更新すると解消されます。

更新するとエラーメッセージの出力が止まり、通常どおりのダッシュボードが表示されるはずです。クラスターのDELETED_FAILEDの表示は本件のエラーとは関係ないので気にしないでください。

原因は?

AWS ParallelCluster Manager は ParallelCluster のクラスターを管理するために ParallelCluster API をラップした Web インタフェースを提供してくれる仕組みです。サーバーレスなアーキテクチャのため、久々に起動すると何かの起動がコールドスタートで遅く失敗しているのではないかと推測しています。

少し放置したり、ブラウザを更新すると解消されることから、サーバーレス故の悩みを抱えているのではないかと思います。

画像引用: pcluster-manager/architecture.png at main · aws-samples/pcluster-manager

おわりに

「なんかエラーがでたんだけど大丈夫なのかな?」と不安に思われる方もいらっしゃるかと思います。現時点ではそういうものなのなんだと認識していだいてご利用いただければよろしいかと思います。ParallelCluster Manager を使ってみてから私はクラスターのログ確認でよく利用しています。便利なので試しに一度使ってもらえると嬉しいです。