Amazon Omics を利用するときに役に立つ資料まとめ2023年版
Amazon Omics がリリースされて2か月余り、出回っている情報が数少なく参考資料を集めるのにも一苦労するかと思います。リリース日から追ってきた先人を代表してAmazon Omics の利用にあたり参考になった資料リンクと検証予定でストックしている資料をまとめました。
※ 2023/2/13時点の情報です。
Amazon Omics
AWS から Omics という名前のサービスが発表されたのは re:Invent 2022 での出来事でした。
オーミクスは、生命の様々な層(クラスター)に存在する大量の生物学的情報の相互作用や機能を解析する科学・工学分野である。 オーミクス - Wikipedia
re:Invent 2022で初お披露目時の動画です。
- AWS re:Invent 2022 - Keynote with Adam Selipsky
- AWS re:Invent 2022 - [NEW LAUNCH!] Transform omics data into insights with Amazon Omics (AIM219) - YouTube
AWS 公式
Amazon Omics 公式ページ
AWS のサービス紹介ページです。料金の確認や、よくある質問が更新されていないか確認しています。
Amazon Omics User Guide
もっとも基本のユーザーガイドです。「○○という機能がある」ということを確認できます。新サービスということもありまだまだ内容が薄くドキュメントを確認しても実際に手を動かさないとわからないことが多いです。
AWS CLI Command Reference / API Reference
ユーザーガイドに記載のない機能や操作は CLI / API リファレンスから確認しています。やりたい操作に該当するコマンドがないか AWS CLI のリファレンスをしばしば確認しています。
Amazon Omics のマネージメントコンソール
ユーザードキュメントに未記載の細々とした情報が注釈としてマネージメントコンソールから確認できたりします。ドキュメントだけではなくマネージメントコンソールから確認するのも有用です。言語設定は英語を推奨します。
マネージメントコンソールの画面に関しては公式のアナウンスのないアップデートを観測しています。資料の外部リンク集のRecsources
カテゴリも更新があるかもしれません。
医療機関のためのAWS
ヘルスケア・ライフサイエンス分野のイベント(ウェビナー)情報です。過去のウェビナーのアーカイブ、資料も公開されています。AWS から最新情報の紹介や、企業様よる導入事例の紹介が行われています。
オススメのウェビナー
2023年1月のウェビナーで Amazon Omics を日本語で説明した資料の存在を確認しました。現時点ではもっとも有用な資料だったのですが動画、資料は公開されておりません。もし公開されたら情報を更新したいと思います。
2023/6/1追記動画が公開されました
チュートリアル
Using Omics storage with genomic references and readsets
Omics Storage の理解を深めるためのチュートリアルです。Jupyter Notebook を使用し SDK(Python)使った演習となっています。
- 想定時間: 20分
Running WDL and Nextflow pipelines with Omics Workflows
Omics Workflows を使用して Nextflow ベースのパイプラインを作成、実行、デバッグする内容のチュートリアルです。同様に Jupyter Notebook を使用します。
- 想定時間: 20分
Querying annotations and variants with Omics analytics
Omics Analytics へバリアント、アノテーションデータの保存、そして、Athena から検索する内容のチュートリアルです。
- 想定時間: 20分
ワークショップ
Amazon Omics - End to End
Amazon Omics のすべての要素が詰まったワークショップです。
- Omics Storage へデータ保存
- Omics Workflows ゲノム二次解析ワークフローの実行
- Omics Analytics へデータ保存と Athena で検索
- 想定時間: 1 - 2時間
このブログを書くために資料を漁っていたら発見しました。やってみてレポートしたいと思います。
AWS ブログ
ゲノムデータおよび生物学的データを大規模に保存、クエリ、分析するための専用サービス
Amazon Omics ローンチと同タイミング公開された最初期の資料です。実行例を交えながら機能を紹介しています。
一見すると簡単なチュートリアル形式になっていますがチュートリアルとして使うには不十分な資料です。リファレンスゲノムをリファレンスストアに保存までは書いてある通りに実行できます。それ以降は実行例のみで手順は省かれおり、手を動かして学ぶことを想定された資料ではありません。
また、ユーザーガイドに記載のない細かい情報が載っていた資料でもありました。
アノテーションストアは、General Feature Format (GFF3)
アノテーションストアがサポートしている GFF データフォーマットのバージョンがユーザーガイドに記載がなく困ったのですが、こちらの資料から Version 3 に対応していることが確認できました。
やってみたブログ
上で紹介している AWS ブログの内容をベースに実際に手を動かしてやってみたレポートです。
関連する要素がわかりにくいため図解した内容です。
セキュアかつ大規模に生物配列データから洞察を得る
Amazon Omics が3つのコンポーネントで構成されていること紹介している資料です。
Amazon Omics を使用したゲノミクスデータの保管と分析のエンドツーエンド自動化
デモ環境を構築して学べる資料です。シーケンスデータの保存、分析に Athena でクエリ可能なデモ環境を構築する Cloudformation テンプレートが公開されています。
デモ環境の構成図
デモ環境を構築して検証予定ですので追って紹介したいと思います。
引用: 上で紹介したAWSブログより
DevelopersIO
クラスメソッドは企業理念「すべての人々の創造活動に貢献し続ける」のもと積極的に情報発信しています。参考にしていただければ幸いです。フィードバックもいただければ尚幸いです。
おわりに
良い資料を見つけたら随時更新する予定です。現時点では日本語のハンズオンや、BlackBelt の資料はありません。Amazon Omics を触ってみるのが学習の近道です。そして AWS へのフィードバックや、ユーザーガイドのアップデートを期待して待ちましょう。
フィードバックは Amazon Omics のマネージメントコンソールから出せます。