Amazon Omics を利用するときに役に立つ資料まとめ2023年版

私がためこんでいる Amazon Omics に関する資料リンク集です
2023.02.12

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Amazon Omics がリリースされて2か月余り、出回っている情報が数少なく参考資料を集めるのにも一苦労するかと思います。リリース日から追ってきた先人を代表してAmazon Omics の利用にあたり参考になった資料リンクと検証予定でストックしている資料をまとめました。

※ 2023/2/13時点の情報です。

Amazon Omics

AWS から Omics という名前のサービスが発表されたのは re:Invent 2022 での出来事でした。

オーミクスは、生命の様々な層(クラスター)に存在する大量の生物学的情報の相互作用や機能を解析する科学・工学分野である。

オーミクス - Wikipedia

re:Invent 2022で初お披露目時の動画です。

AWS 公式

Amazon Omics 公式ページ

AWS のサービス紹介ページです。料金の確認や、よくある質問が更新されていないか確認しています。

Amazon Omics User Guide

もっとも基本のユーザーガイドです。「○○という機能がある」ということを確認できます。新サービスということもありまだまだ内容が薄くドキュメントを確認しても実際に手を動かさないとわからないことが多いです。

AWS CLI Command Reference / API Reference

ユーザーガイドに記載のない機能や操作は CLI / API リファレンスから確認しています。やりたい操作に該当するコマンドがないか AWS CLI のリファレンスをしばしば確認しています。

Amazon Omics のマネージメントコンソール

ユーザードキュメントに未記載の細々とした情報が注釈としてマネージメントコンソールから確認できたりします。ドキュメントだけではなくマネージメントコンソールから確認するのも有用です。言語設定は英語を推奨します。

マネージメントコンソールの画面に関しては公式のアナウンスのないアップデートを観測しています。資料の外部リンク集のRecsourcesカテゴリも更新があるかもしれません。

医療機関のためのAWS

ヘルスケア・ライフサイエンス分野のイベント(ウェビナー)情報です。過去のウェビナーのアーカイブ、資料も公開されています。AWS から最新情報の紹介や、企業様よる導入事例の紹介が行われています。

オススメのウェビナー

2023年1月のウェビナーで Amazon Omics を日本語で説明した資料の存在を確認しました。現時点ではもっとも有用な資料だったのですが動画、資料は公開されておりません。もし公開されたら情報を更新したいと思います。

2023/6/1追記
動画が公開されました

チュートリアル

Using Omics storage with genomic references and readsets

Omics Storage の理解を深めるためのチュートリアルです。Jupyter Notebook を使用し SDK(Python)使った演習となっています。

  • 想定時間: 20分

Running WDL and Nextflow pipelines with Omics Workflows

Omics Workflows を使用して Nextflow ベースのパイプラインを作成、実行、デバッグする内容のチュートリアルです。同様に Jupyter Notebook を使用します。

  • 想定時間: 20分

Querying annotations and variants with Omics analytics

Omics Analytics へバリアント、アノテーションデータの保存、そして、Athena から検索する内容のチュートリアルです。

  • 想定時間: 20分

ワークショップ

Amazon Omics - End to End

Amazon Omics のすべての要素が詰まったワークショップです。

  1. Omics Storage へデータ保存
  2. Omics Workflows ゲノム二次解析ワークフローの実行
  3. Omics Analytics へデータ保存と Athena で検索

  • 想定時間: 1 - 2時間

このブログを書くために資料を漁っていたら発見しました。やってみてレポートしたいと思います。

AWS ブログ

ゲノムデータおよび生物学的データを大規模に保存、クエリ、分析するための専用サービス

Amazon Omics ローンチと同タイミング公開された最初期の資料です。実行例を交えながら機能を紹介しています。

一見すると簡単なチュートリアル形式になっていますがチュートリアルとして使うには不十分な資料です。リファレンスゲノムをリファレンスストアに保存までは書いてある通りに実行できます。それ以降は実行例のみで手順は省かれおり、手を動かして学ぶことを想定された資料ではありません。

また、ユーザーガイドに記載のない細かい情報が載っていた資料でもありました。

アノテーションストアは、General Feature Format (GFF3)

アノテーションストアがサポートしている GFF データフォーマットのバージョンがユーザーガイドに記載がなく困ったのですが、こちらの資料から Version 3 に対応していることが確認できました。

やってみたブログ

上で紹介している AWS ブログの内容をベースに実際に手を動かしてやってみたレポートです。

関連する要素がわかりにくいため図解した内容です。

セキュアかつ大規模に生物配列データから洞察を得る

Amazon Omics が3つのコンポーネントで構成されていること紹介している資料です。

Amazon Omics を使用したゲノミクスデータの保管と分析のエンドツーエンド自動化

デモ環境を構築して学べる資料です。シーケンスデータの保存、分析に Athena でクエリ可能なデモ環境を構築する Cloudformation テンプレートが公開されています。

デモ環境の構成図

デモ環境を構築して検証予定ですので追って紹介したいと思います。

引用: 上で紹介したAWSブログより

DevelopersIO

クラスメソッドは企業理念「すべての人々の創造活動に貢献し続ける」のもと積極的に情報発信しています。参考にしていただければ幸いです。フィードバックもいただければ尚幸いです。

おわりに

良い資料を見つけたら随時更新する予定です。現時点では日本語のハンズオンや、BlackBelt の資料はありません。Amazon Omics を触ってみるのが学習の近道です。そして AWS へのフィードバックや、ユーザーガイドのアップデートを期待して待ちましょう。

フィードバックは Amazon Omics のマネージメントコンソールから出せます。