Amazon Genomics CLI が静かに End of Support を迎えていました
HPC 系サービスを定期的にチェックしていたつもりでしたが、最近のイベント登壇準備中に、Amazon Genomics CLI のサポート終了を知りました。このツールの存在自体があまり知られていなかったかもしれませんが、AWS のゲノム解析サービスの歴史として紹介します。
伝えたいことまとめ
- Amazon Genomics CLI の GitHub リポジトリは 2024 年 5 月 31 日にアーカイブされました。
- 代替サービスとして AWS HealthOmics が提供されています。
Amazon Genomics CLI とは
簡単に言えば、AWS Batch をラップしたゲノム解析処理を実行できるコマンドラインツールでした。
Amazon Genomics CLI は、ゲノム解析処理のための実行基盤構築とワークフロー実行を可能にするコマンドラインツールでした。OSS として提供され、その実行基盤には AWS Batch が利用されていました。
AWSが提供するゲノム解析向けのサービス
ゲノム解析には一般的に大規模なコンピューティングリソースが必要です。EC2 単体でも処理可能ですが、スケーラビリティや実行管理を考慮すると、ParallelCluster などの HPC 系サービスの利用が一般的です。Amazon Genomics CLI はこの分野ではかなりマネージドなサービスの位置づけでした。
代替サービス:AWS HealthOmics
AWS HealthOmics が Amazon Genomics CLI の代替サービスとなっています。
HealthOmics は Amazon Genomics CLI と比べるとよりマネージドなサービスです。カスタマイズが必要な場合は、AWS Batch を使用した独自の環境構築を検討することをお勧めします。
詳細については以下の記事をご参照ください。
HealthOmicsのワークフロー言語対応状況
HealthOmics は以下のワークフロー言語に対応しています。
- WDL
- Nextflow
- CWL
HealthOmics は、バイオインフォマティクス分野で人気のワークフロー言語をサポートしている唯一の AWS サービスです。 Amazon Genomics CLI で実行していたワークフローの乗り換え先としてファーストチョイスと考えるのは悪くはないです。
詳細は以下の記事をご覧ください。
おわりに
AWS で実行するゲノム解析をもう少し詳しく知りたい方は以下の記事もご参照ください。