AWS ParallelCluster を学ぶための教材をまとめました - 2025 年版

AWS ParallelCluster を学ぶための教材をまとめました - 2025 年版

長期休暇で AWS ParalleCluster を学びたい稀有な方向けの記事です。
2025.12.20

はじめに

AWS 初学者が ParallelCluster を学ぶために必要なコンテンツを整理したので紹介します。できるだけ新しめのコンテンツをピックアップしてきたのでご活用ください。

parallelcluster-learning-flow.png

トラブルシューティングやコスト最適化などの参考情報として後半に参考情報として記載しました。

まず手を動かす

ParallelCluster を学ぶには 1 回クラスターを作成してジョブを実行してみた方が良いです。まずは公式ワークショップで手を動かしましょう。

公式ワークショップで触って学ぶ

  • 2025 年 11 月に更新された新しいコンテンツ
  • 日本語がベースで英語翻訳版より読みやすい
  • ParallelCluster 3.14 を使用(2025 年 12 月時点の最新バージョン)
  • 所要時間目安: 2 時間

https://catalog.us-east-1.prod.workshops.aws/workshops/f2b80cb7-e073-4226-9256-41c3d68129c4/ja-JP

このワークショップから得られるもの

  • クラスターの構築から削除までの一連の流れ
  • Slurm コマンドの基本操作
  • ジョブ投入と実行結果確認

一部に古い名称(マスターノード)や、Cloud9 の記述が残っています。アプリケーションの実行は N-queens 実行まで確認しておきましょう。赤枠の箇所を実施すれば初歩として十分です。

ParallelCluster_3_workshop__Japanese_English_.png

AWS 基礎知識の学習

ハンズオンで ParallelCluster を一度触ってみたら、今度は ParallelCluster 周りで頻出する AWS サービスを知っておきましょう。

なぜ AWS サービスを学ばないいけないのか

ワークショップで以下のような疑問を持ちませんでしたか。

  • 計算リソースの要求スペックに該当する EC2 のインスタンスタイプは何か
  • データを保存する共有ストレージは EBS でよいのか、安いと聞く S3 というのがいいのか
  • 風の噂で聞いたスポットインスタンスとはなんなのか

これらの疑問を解消するには、ParallelCluster の基盤となる AWS サービスの理解が必要です。

推奨講座

AWS の試験勉強でよく使われる AWS Black Belt 動画で学びましょう。比較新しいものだけピックアップしました。以下の順序での学習を推奨します。

学習内容

順序 公開日 リソース 利用場面
1 2025/12 今更聞けない Amazon EC2 インスタンスの選択肢 ヘッドノード・コンピュートノードの選定基準
2 2024/12 Amazon EBS 基礎編 ヘッドノード・コンピュートノードに必須の一番基本的なストレージ
3 2022/12 Amazon S3 入門編 入力データの保存先、実行結果のアーカイブ
4 2023/04 Amazon EC2 スポットインスタンス活用のための 6 つのベストプラクティス 計算リソース代の削減手段

共有ストレージも学ぶ(オプション)

高価なハイスペックなコンピュートノードを使って計算処理しても、データの読み込み元、書き出し先のストレージが低スペックだとボトルネックになりがちです。

storage-bottleneck-graphrec.png

ParallelCluster でよく利用する共有ストレージは以下のコンテンツを学習してください。なにを使っていいかわからなければ、EFS と FSx for Lustre を抑えておけば大丈夫です。

EFS を使用する場合

EFS はスモールスタートに最適な共有ストレージです。セットアップがとにかく簡単です。数 100GB 以上のデータを常時保存したり、データ読み取り、書き込みで高負荷がかからない限りは低コストで済みます。EFS でも工夫すれば安く利用できるのですが、性能不足を感じたり保存容量の増加でコストが気になる場合は、FSx for Lustre または OpenZFS への移行を検討してください。

公開日 リソース 学ぶべきポイント
2024/03 Amazon EFS バーストモード、エラスティックスループットモード

FSx for Lustre を使用する場合

FSx for Lustre は HPC ワークロードでもっともよく使われる分散ファイルシステムです。大規模なファイル(数 GB 以上)の高速な読み書きが必要なワークロードに最適です。

公開日 リソース 学ぶべきポイント
2022/02 Deep Dive on Amazon FSx for Lustre 分散ファイルシステムの特性、S3 統合
2022/02 分散並列ファイルシステム Amazon FSx for Lustre の Deep Dive 日本語でのレポート

FSx for OpenZFS を使用する場合

FSx for OpenZFS は小さいファイルを大量に扱うワークロードに適しています。Lustre が不得意とする小さいファイル(数 MB 以下)を多数扱う場合の共有ストレージとして最適です。

公開日 リソース 学ぶべきポイント
2022/05 Amazon FSx for OpenZFS ZFS の特性

参考情報

トラブルシュート

HPC 向けの AWS アカウントの基本的な設定

HPC 向けに基本的な設定や、制限がかかっていないか AWS アカウントの設定する場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/hpc-aws-account-setup-5-checkpoints/

トラブルシュート全般

トラブっているけど、どこからどう切り分けていいかわからない場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/troubleshooting-when-creating-cluster/

スポットインスタンスが起動しない

ジョブを投入してもコンピュートノードが起動せず、ジョブが待機状態のまま動かない場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/aws-parallelcluster-spot-launch-problems/

https://dev.classmethod.jp/articles/aws-parallelcluster-spot-launch-problems-2/

やりたいこと(設定・機能追加)

クラスター設定を変更したい

既存クラスターのインスタンスタイプやストレージ設定を変更したい場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/how-to-update-parallelcluster-for-fish/

ジョブ履歴を保存・分析したい

どのユーザーがいつどのジョブを実行したか記録したい場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/aws-parallelcluster-slurm-accounting-setup-guide/

https://dev.classmethod.jp/articles/aws-parallelcluster-slurm-accounting-database-troubleshooting/

ヘッドノードのインスタンスタイプとサイズの選定

どのインスタンスタイプとサイズを選ぶか悩んでいる場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/aws-parallelcluster-head-node-memory-sizing-guide/

配分戦略の選択

スポットインスタンスの配分戦略をどうするか悩んでいる場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/aws-parallelcluster-allocationstrategy-guide/

FSx for Lustre の容量を削減したい

FSx for Lustre と S3 を連携させた構成で、Lustre ファイルシステム上のファイルを S3 へエクスポート後、Lustre から削除したいときは、以下の記事を参照してください。

https://dev.classmethod.jp/articles/amazon-fsx-lustre-data-repository-task-export-release/

コストを把握・管理したい

クラスター単位のコストを追跡したい場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/how-to-track-costs-for-aws-parallelcluster/

https://dev.classmethod.jp/articles/set-cost-allocation-tag-for-parallelclsuter/

GUI でクラスターを管理したい

CLI 操作が苦手なので GUI でクラスターを管理したい場合は、以下の記事を参照してください。

https://dev.classmethod.jp/articles/web-browser-hpc-cluster-management-parallelcluster-ui/

まとめ

AWS ParallelCluster の学習リソースを、「まず手を動かしてから学ぶ」方針で紹介しました。

おわりに

私は AWS の基礎知識がある状態で ParallelCluster デビューしたのですけど、AWS 初学者の場合でも一度クラスターを触ってから学習した方がよいかなと思っています。ちなみに教材はどれがいいかは 2 年 1 度は聞かれる質問でして今回はブログにまとめてみました。

この記事をシェアする

FacebookHatena blogX

関連記事