[レポート]新発表されたAWS Clean Rooms(プレビュー)でプライバシー強化されたコラボレーション #ADM305 #reinvent

2022.12.04

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データアナリティクス事業本部の鈴木です。

AWS re:Invent 2022のAdam Selipsky Keynoteにて、AWS Clean Rooms(プレビュー)の発表がありましたが、早速セッション番号ADM305で『[NEW LAUNCH!] Privacy-enhanced collaboration with AWS Clean Rooms』が開催されていたので参加してみました。

セッションについて

登壇者

  • Ankur Agarwal, Principal Product Manager, Amazon Web Services
  • Shaila Mathias, Senior Business Development Manager, AWS
  • Brian Pugh, Cio, Comscore

Session level

300 - Advanced

Session type

Breakout Session

動画

追加されたので記載しました。(2022/12/16追記)

セッション概要

AWS Clean Roomsについて、どのようにユーザーをサポートしてくれるのか見る初めてのセッションです。AWS Clean Roomsにより、パートナー間で生データを共有しなくても、簡単に共同作業ができるようになります。AWSのエキスパートから使い方を学ぶことができます。

AWS Clean Roomsについて、そのコンセプトと使い方を、デモを交えつつ学ぶことができました。Breakout Sessionなので、大きめの会場でスライドを使って発表が行われました。前日に追加されたセッションでありつつも、会場はほぼ満員で、セッション終了後には会場前方が質問・感想を伝えたえる参加者で溢れていたのがとても印象的でした。

発表概要

スライド・デモを用いて、3名にて発表が行われました。発表者ごとに担当パートを分けて「概要・コンセプトについての説明」「デモンストレーション」「事例紹介」の3つの説明がありました。

概要・コンセプトについての説明

AWSの利用者は多くのパートナーと共同作業がしたいと思っています。例えばAWSのマーケターも、広告効果と顧客行動のより良い理解のために、パートナーのデータと自社データを組み合わせた分析をやりたいそうです。一方でこの実現のためには、データの断片化やサイロ化・急増・保護の必要性という困難に直面します。多くの場合、データは企業のビジネスユニット単位で異なる標準やアプローチで収集・蓄積されていますし、量自体も日々急増し続けています。その中で顧客のプライバシーを保護しつつ、上手く管理していくのは大きな課題です。

導入

それをサポートするのがAWS Clean Roomsです。AWS Clean Roomsは元々、広告・マーケティングのお客様の、広告効果や顧客行動をよりよく理解したいというニーズから生まれたサービスとのことでした。金融サービス企業やヘルスケア企業などさまざまなお客様が、生データを互いに共有・開示することなく、組み合わせたデータセットを使って簡単かつ安全に共同利用できることを目指しています。

AWS Clean Roomsとは

例えばAWSのマーケターだと、以下のようなことをAWS Clean Roomsを使う目的としています。

目的例

共有したいデータは近年非常に大きいサイズ(何テラバイトなど)であることがあり、この非常に大きなデータを安全に使っていきたいとみんな思いつつも、一般的にはその扱いづらさゆえにプライバシー保護が犠牲になったり、膨大すぎる開発コストがかかったりしているのではないでしょうか。AWS Clean Roomsを使うとこの点を非常に簡単に解決できるようです。

AWS Clean Roomsの動作イメージとしては、複数のデータソースがあったとして、それらを保護しつつ、分析アカウントのS3バケットに安全なデータを出力します。そしてそれらを各種サービスにて利用していくことになります。

動作イメージ

デモンストレーション

※全体の流れが分かるかの観点で記載します。

ある航空会社が、頻繁に出張する旅行者を対象とした広告キャンペーンをパブリッシャーのプラットフォーム上で行うという題材のデモでした。

デモの題材

デモは以下の4ステップで行われました。

  1. コラボレーションのメンバーの1人がコラボレーションを開始し、他のメンバーをコラボレーションに招待する。
  2. 招待されたメンバーがコラボレーションに参加し、Configured Table(S3への参照情報、コラボレーション内でデータがどのように使用されるかの分析ルールが含まれる)を作成する。
  3. Configured Tableをコラボレーションに紐づける。
  4. データを照会する権限を持つユーザーで動作確認する。

ワークフロー

2つのAWSアカウント(ダークモードのブラウザ画面の航空機会社アカウント・通常モードのブラウザ画面のパブリッシャーアカウント)を利用します。まずダークモードのブラウザ画面のアカウントからCollaborations画面でCreate Collaborationを押して新しいCollaborationを作ります。このとき、どのAWSアカウントをメンバーにするかなど設定していきます。

招待の仕方

招待されると、Collaborations画面に招待が届きます。(このときはまだ届いていない画面になっていますが、リロードすると招待が確認できていました)

コラボレーション画面

次に招待された側のアカウントでConfigure new tableからConfigured Tableを作っていきます。

新しいテーブルの設定

特に、どのカラムにアクセスさせるかや、どういった種別のクエリを可能にするか設定していました。

タイプの選択

Configured Tableをコラボレーションに紐付けます。

コラボレーションへの紐付け

これができると、招待した側のアカウントから検索をかけられるようになるので、制御が正しく機能しているか実演していただきました。

例えば、許可されていない種別のクエリだと以下のように実行が拒否されてしまいますが、

失敗の例

許可されている種別のクエリだと実行ができました。

成功の例

画面はAthenaっぽいUIになっていて、Athenaを使い慣れている方だと特にわかりやすいかなと思います。データはS3から読み取られ、クエリ側のS3に保存されるようです。

Q: Do I have to store my data in AWS Clean Rooms to be able to use it in a collaboration?

No. AWS Clean Rooms temporarily reads data directly from your designated Amazon Simple Storage Service (S3) location to run queries on behalf of the respective collaboration member. The output of the analysis is delivered to the Amazon S3 location designated by the member who can query.

AWS Clean Rooms FAQs – Secure Collaboration – Amazon Web Services

事例紹介

Comscore社でのメディアプランニングの例を紹介頂きました。Comscoreで算出する測定結果をより正確にするためには、インターネットの普及などで発生したさまざまなデータと併わせて分析する必要があり、そのためには他社とコラボレーションする必要があるそうです。また、ユーザーが一方で、情報の発生元となる個々のユーザーは、自身の行動を追跡されることをあまり望んではいません。そこでAWS Clean Roomsを活用できるそうです。

UDM

優先的なユースケース

変化

Comscore社へのデータ共有は、ウェブサイト上にタグを埋めるようなものがあり、CloudFlontを通してS3上に集めているそうです。

加えて他社企業アカウントのS3をインターフェースにデータを連携されるような口も存在します。これらの統合を行う際に、AWS Clean Roomsを利用しているようです。

clean roomsを使った分析

まとめ

AWS Clean Roomsは広告とマーケティング以外の業界にも広く適用できます。数クリックでコラボレーションを開始できますし、AWS上の多数のパートナーアカウントと生データを共有したり公開したりすることなく一緒に活用することができます。分析ルールを使ってクエリを調整できます。

なにができるようになるか

Clean Roomsは何を助けるか

おわりに・感想

この記事では、AWS Clean Rooms(プレビュー)の紹介セッションである『[NEW LAUNCH!] Privacy-enhanced collaboration with AWS Clean Rooms』のレポートをお伝えしました。

感想としては、コラボレーションに紐づけたConfigured Tableの設定をUIで設定可能で、さらにAthenaに似たUIでデータをアカウント間で安全に活用できるようになるのはとても使いやすそうに感じました。これまではこのような権限設定や、実行できるクエリの制限をしようと思うと相当大変な開発コストがかかるはずですが、それを20分程度のデモで説明しきれてしまうのはすごいです。また、コラボレーションに参加するかや、Configured Tableの設定は生データを保有している側で設定するので、そこで責任が分けられているのもよいと思いました。

まだプレビュー版の発表がされて間もないですが、実際のプレビュー版の利用開始や、それに伴ってこのセッション以外にもさまざまな資料やチュートリアルが公開されるのが待ち遠しいですね。追加の情報があればブログ化していければと思います!