[アップデート]AWS Clean Rooms Differential Privacyがプレビュー提供されました #AWSreInvent
データアナリティクス事業本部 機械学習チームの鈴木です。
AWS Clean Rooms Differential Privacyのプレビュー提供が発表されました。
AWS Clean Rooms Differential Privacyについて
データベースから統計的な出力を取得する際の差分プライバシーというプライバシー基準を満たすようにクエリにノイズを付与することにより、意味のある洞察を行うために十分な正確性を維持しつつ、個人の寄与を隠蔽したクエリ結果を出力する機能です。
AWS Clean Rooms Differential Privacyを使うことで、差分プライバシーを実装するための深い理解をしていなくても、AWS Clean Roomsのフルマネージド機能として利用することができます。
AWS Clean Roomsでの仕組みのイメージは以下のAWS News Blogが参考になりました。
差分プライバシー自体については、『差分プライバシーによるクエリ処理の基本の「キ」』が非常に参考になりましたのでぜひご確認頂ければと思います。
差分プライバシーを設定してみる
実際に通しての設定からクエリまでは改めて検証してまとめようと思うので、今回はひとまず設定内容についてみていこうと思います。
差分プライバシー有効化の設定
まず、差分プライバシーの有効化は、AWS Clean Roomsに設定済みのテーブルに設定する分析ルールの内容でした。
例として、適当なテーブルに対して分析ルールを設定してみました。
まずステップ1
の分析ルールタイプを選択
を確認すると、カスタム分析ルールタイプに差分プライバシーをサポート
と表示がされていました。ここではカスタムを選択して次に進みました。
ステップ2
として差分プライバシーを設定
からオンにできるようになっていました。
オンにする
を選択すると、ユーザー識別子列を選択できました。
ステップ3
は以下のようでした。今回は特定のコラボレーターが作成したすべてのクエリを、このテーブルで確認せずに実行できるようにする
にしました。AWSアカウントを設定できるので、ここにコラボレーターのアカウントを設定するとよさそうでした。
また、差分プライバシーをオンにしている場合に関する注意事項が表示されていました。(「詳細」のリンク先は『Query structure and syntax』)
差分プライバシーポリシーの設定
プライバシーバジェットはコラボレーションにテーブルを関連づける際に、差分プライバシーポリシーの設定でできました。
自分はデータを寄稿でコラボレーションを作成し、テーブルを関連づけしました。すると差分プライバシーポリシーの設定を求められたのでボタンを押してみました。
設定内容としては以下のようになっていました。
設定すると、以下のようになりました。
最後に
プレビュー提供開始が発表されたAWS Clean Rooms Differential Privacyのご紹介でした。