[レポート] 機械学習に関する Amazon Research Award 受賞者の講演を聴講しました(その1) #reinvent #AIM408

本エントリはAWS re:Invent 2022のセッション「From cutting-edge ML research to product with the Amazon Research Awards (AIM408)」のレポートです。
2022.12.08

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんちには。

データアナリティクス事業本部 機械学習チームの中村です。

re:Invent 2022に現地で参加し、機械学習系のセッションをメインに回っていました。

本記事では「From cutting-edge ML research to product with the Amazon Research Awards」というセッションに参加しましたので、そのレポートをします。

セッションについて

  • タイトル
    • From cutting-edge ML research to product with the Amazon Research Awards
  • 登壇者
    • Philip Resnik, Professor, University of Maryland
    • Jon Tamir, Assistant Professor, The University of Texas at Austin
    • Naina Prasad, Senior Technical Program Manager, AWS
  • セッション情報
    • 日時: 2022-11-29 (Tue) 12:30-13:30
    • 形式: Breakout Session
    • 番号: AIM408
    • 会場: Mandalay Bay (Level 2 South, Lagoon L, Mandalay Bay)
    • レベル: 400 - Expert

内容は、Amazon Research Award 受賞者から、その最先端の研究内容に関する発表です。

セッション概要

事前の案内としては以下の通りです。

Machine learning helps researchers pursue the major real-world problems that were previously thought to be unsolvable. The Amazon Research Awards (ARA) program supports research across academic institutions and nonprofit organizations to advance the solutions for these real-world problems. Join this session to hear from two ARA award recipients, Professor Philip Resnik and Assistant Professor Jonathan Tamir, on how they are using cutting-edge machine learning techniques and AWS services to tackle high-impact problems and influence the future of research.

(日本語訳)

機械学習は、これまで解決不可能と考えられていた実世界の大きな問題を追求する研究者を支援します。Amazon Research Awards (ARA) プログラムは、こうした実世界の問題の解決策を進めるために、学術機関や非営利団体を横断して研究を支援しています。本セッションでは、ARA受賞者のPhilip Resnik教授とJonathan Tamir助教授から、最先端の機械学習技術とAWSサービスを利用してインパクトのある問題に取り組み、研究の未来に影響を与えている様子を伺います。

セッション動画

セッション聴講内容

受賞者は2名いらっしゃいましたので、本記事では1番目に発表された方の内容についてのものとなります。

タイトルは「Mental Health and AI: From language analysis to clinical utility」となっています。

内容は、メンタルヘルス分野に置ける言語分析に関する研究についてです。

Amazon Research Award (ARA)とは

受賞者の発表に先だって、Amazon Research Awards (ARA)についての説明もされました。

ARAのサイクルについても説明がありました。提案を募集、計画をプレゼン、査読して選考、研究資金の提供というフローです。

課題

現在のメンタルヘルスの課題について説明がされました。

実際に精神科医に診察してもらうのはとても時間が掛かること(1か月以内は幸運な方)、 50年以上に渡って自殺行動の予測は改善していないこと、などの説明がありました。これをテクノロジーで改善できる兆しがあります。

以下は自殺でなくなった人の家族や、自殺未遂の経験者、あるいは単にデータを提供したい人が投稿したTwitterのデータセットをつかって、 そのデータセットに含まれる誰かが自殺したのか、あるいは自殺しようとしているのかを予測した結果です。

結果、90〜95パーセントがtrue-positiveで、false positiveはわずか10〜20パーセントでした。 (これで良いか悪いかは、positiveの割合にはよると思いますが、発表者によれば良い結果であるとのこと)

しかしここからどうするのか?が大事で、テクノロジーのみでは解決策にはならないという点は印象的でした。

この問題における専門家と技術者が関わりあうことが重要で、専門家はなにが必要か(ニーズ)を理解しており、技術者は何が可能か(ソリューション)を理解しています。なのでニーズとソリューションのマッチングが重要です。

ニーズにマッチングしたソリューション

ニーズにマッチングしたソリューションとして3つが紹介されていました。

データの提供方法

その一つはデータ提供の方法で、データはNORCが提供するData Enclaveを使用してデータを外に持ち出せないようにして提供。

基本的には、機密性の高いメンタルヘルスデータを安全に取得し、かつそこでのみ作業を行うことができるようにする環境で、 センシティブなデータであるため、コピーはできないようなシステムとなっているとなっており、解析はData Enclave内で機械学習のツールを扱って解析されます。 またData Enclaveのデータ自体はAWS上にバックアップされているとのことでした。

クラス分類から優先順位付けへ

また2つ目としては、クラス分類だけでは不十分であり、優先順位付けをする必要があり、そのためになぜこの人は自殺リスクがあるのかを見える化する必要があるという点です。

その分析のために、階層的なAttention Networkを以下の3層で構成しています。

  • 単語(Words)→文(Sentences)
  • 文(Sentences)→文書(Document)
  • 文書(Document)→各個人(Individual)

この階層構造によりAttentionスコアを使えば、どこに注目しているのかをランキング化して優先順位を決めることができ、可視化することができます。

生活体験からの洞察

最後に挙げられていたのが、生活体験からの洞察を得ることです。 生活体験は、要するに臨床外における患者の活動のことのようで、今日はSNSなどを情報源として使用できるということをおっしゃられているようでした。

分析には、top-down的な観点(こういった表現は専門家の観点からリスクが大きい)に加えて、

bottom-up的な観点でもアプローチしているようです。

より具体的には、LDAを使用して生のテキストを解釈可能なカテゴリ情報に変換することを実施されていました。

またその他に、ほとんどの自殺研究は、人がなぜ自殺してしまうのかに焦点を当てていますが、同時になぜ人は死なないのか、なぜ生きるのか、という重要な研究もありますが、こちらはあまり研究されてないとのこと。

それらを分析するために、以下の質問を募集し、

その回答をLDAにより分析して、その分析された結果を人間によりキュレーションします。具体的には2名の独立した専門家により目を通してもらい、そのLDAが計算したカテゴリが何に関するものに値するのかをコンセンサスを得る仕組みです。

このようにして、技術者のソリューションと専門家の知識が融合させられるのだなととても感心しました。

こうして得られた4つの観点について説明がありました。

まずは、残された家族を傷つけたくない、またはペットを飼っていると自殺を思いとどまる傾向があるとのこと。

次は、前向きに物事を考えるということ。

もう一つは、Simple Pleasuresということで、例えば次のテイラー・スウィフトのアルバムがどうなるか、 というようなことが思いとどまるきっかけになるようです。 これは驚きですが、実際に臨床医が、人々の生活体験の中にある予期せぬこれらのライフラインであることに気づけばより 効果的に人と接することができるはずとのこと。

最後のカテゴリは、自分が生きていることを誰かに示したいから、という話でした。

総括

総括として発表者は、ある問題を解決するためにいつもアプリや技術を持って彼女(登壇者の妻である臨床医)のところにやってきて、 これが助けになると言ってくることがあるが、しかしそのような人は実際の専門医と話したことがないとおっしゃられていました。

何が必要かを理解している人たちに、何が可能かを実際に話す技術者の一人になってくださいとのことで、 技術者として得るものがあった発表だと思いました。

まとめ

いかがでしたでしょうか。実用的な分析の手法だけでなく、どうやって必要とされているものをエンジニアとして提供していくのか、 幅広い視点で勉強になるセッションでした。

日々の業務でも心がけて、社会に影響のあるものを作っていきたいと気持ちを新たにすることができました。