オープンデータによる次世代サステナビリティ・ワークロードの構築 #AWSreInvent #SUS304

re:Invent2023のセッション「Building next-generation sustainability workloads with open data」についてのレポートです。
2023.12.10

AWS認定トレーニング講師の平野@おんせん県おおいたです。

今日は「Building next-generation sustainability workloads with open data」というタイトルのセッションについてレポートします。

公式セッション紹介(日本語訳)

将来のサステナビリティ・デジタル・テクノロジーはデータによって推進されるが、サステナビリティ・データセットへのアクセスは限られており、取得には多大なコストがかかるため、サステナビリティ・データセットの構築を志す人々には障壁となっている。Open Data on AWSのようなプログラムは、サステナビリティ・イノベーションを加速する、無料で一般公開されたデータセットを提供します。本セッションでは、AWSのお客様がどのようにオープンデータとAWSの幅広いコンピュート、AI/ML、データベースサービスを利用してクラウド上でサステナビリティワークロードを構築しているかをご紹介します。グローバルな生物多様性の変化を理解し、対処するためのミッション主導型の研究ツールであるNatural History Museum Planetary Knowledge Baseについて、AWS Glue、Amazon Neptune、Amazon Neptune MLを使用してオープンデータで構築された事例をご紹介します。

オンデマンド動画

概要/オススメポイント

サイエンスの世界においては、これまで世界中の研究機関の成果として、多くの研究結果(データー)が存在しています。そしてこれらがオープンデータとして公開され始めています。

AWSではこれらのオープンデータを利用出来るプラットフォームを提供しています。

オープンデータ化することで、一つの共通化された知識ベースを構築することが出来ます。

ちなみにオープンデータ化するためには、データのデジタル化が必要ですが、それもAIテクノロジーを利用して自動化が進んでいます。

ココまでの話を踏まえて、後半では具体的な事例紹介/デモがあります。 知識ベースのグラフ構造(ネットワーク構想)を分析していきます。

今回はAWS Glue, Neptune, SageMakerを利用し、グラフ構造+機械学習ベースのシステムを構築しています。

このような知識ベースには様々な可能性があります。そしてオープンデータ化とAWSのサービスを活用することで、これまで眠っていたデータから様々な発見ができる可能性があります。

サイエンティストの方や、環境問題に興味がある方にオススメのセッションです。

まとめ

セッションの概要を紹介しました。ご興味があれば上記のリンクよりセッション動画をご覧ください。

また、英語が苦手な方は、YouTubeの概要欄の「文字起こし表示」を活用してみて下さい。例えば文字起こしのテキストを翻訳ツールに簡単にコピペできます。

皆様のスキルアップのお手伝いになれば幸いです。