【レポート】ライフサイエンスの未来の研究室 #LFS302 #reinvent

2019.12.10

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。AWS事業本部のKyoです。

AWS re:Invent 2019のセッション「Labs of the future in Life Sciences(LFS302)」についてレポートします。

登壇者

Sanford Coker - WW SA Lead - Healthcare, Amazon Web Services Lance Smith - Director Cloud & HPC, Celgene Pascual Starink - Sr. Director, BRM Translation and Early Development, Starink

概要

Research labs can be challenged by the large volume of data acquired by legacy research equipment that is locally stored and limits capabilities for that data to be securely archived, processed, and shared with collaborators globally. In this session, learn how AWS services like AWS DataSync and AWS Storage Gateway provide a way for researchers to transfer instrument data into the cloud, ensuring important experimental data is securely stored and archived, and available to be accessed by other permissioned collaborators. Additionally, learn how pharma companies are utilizing Amazon AI/ML services to inform and streamline research analyses to support data-driven laboratories.

クラウドインテグレーション: ラボサイエンス

Celgene

  • Immunology biotech
  • R&D, 製造, セールス
  • グローバルフットプリント
  • クラウドファースト戦略

クラウドへのデータ移行

ユースケース

  • 一次処理のためのデータ転送
  • ローカルのディスクにおける隠しファイルの管理
  • データのアーカイブ
  • マシンラーニングおよび解析データの一元化

チャレンジ

  • 短期的なアプリの変更は不可能
  • ヒトとプロセスの変更は非常に大変
  • データ転送の時間とレイテンシ
  • オフラインデータの移動にかかる時間

なぜAWSのストレージ?

  • メンテナンス不要
  • 値段も良い
  • サービスとの統合がいい
  • 無限のスケーラビリティ

ストレージオプション(DBは除く)

  • S3
  • EFs
  • FSx
  • EBS

セキュアなデータ

  • Dataencryption
  • AWS Security Hub
  • Amazon VPC
  • turbot: クラウド用の自動化されたガードレール

転送オプション

ネットワークオプション

実際のアーキテクチャ

一部を専用線でつなぎ、最終的にはデータをS3に集める。これをSageMaker, Lambda, EC2といった処理系に回す。S3のデータはAthanaで分析することも。

デジタル病理学画像解析

分析のワークフロー

  1. イムノアッセイ
  2. イメージの取得
  3. データの可視化

S3を使って複数拠点とコラボレーションを実施

細胞のフェノタイピング

  • 市販のソフトは汎用的すぎる
  • AIの検出は?

  • 現在のDeep Learningは人より低いエラー率を出せる
    • ILSVRC : The ImageNet Large Scale Visual Recognition Challenge。大規模画像処理の競技会。

チャレンジ

  • トレーニングデータが欠けている
  • 画像のピクセルにバリエーションがある
  • 細胞がクラスター化している
  • 細胞数

SageMakerによるMachine learning model

全体的に非常に高い精度が認められます。

終わりに

前半パートでは、AWSとしてベーシックな構成で研究データの共有を加速できるという印象を受けました。

後半パートでは、ラボにおけるAI/MLの今という内容で画像解析について話されていました。ハイスループットスクリーニングにはさぞ効果を発揮するかと思います。

以上、何かの参考になれば幸いです。