[ワークショップレポート] 責任あるAIの推進 – バイアスの評価と透明性について #reinvent #AIM342

せーの

2022.12.03

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

せーのでございます。

このブログでは2022/11/28（現地）より行われておりますAWS最大のカンファレンス「re:Invent 2022」よりワークショップ

Advancing responsible AI: Bias assesment and transparency

の様子をレポートいたします。

レポート

形式としては手書き文字の学習を通じて「バイアス」がどの程度存在しているかをみんなで話し合う、という内容でした。

まずは座学です。

手書きの数字がある
この数字には様々な属性がある
- 数字の種類
- 色など
- 曲線か、直線か
この数字が人だと仮定する
シナリオ
- あなたはAIシステムのマネージャーです
- ライブラリへのアクセスを許可することを目的としている
- 番号は人である
- 番号自身が自撮りした写真を元にアクセスするかどうかを決める
個々の番号はライブラリへのアクセスを制限するような望ましくないバイアスを受けるのか
人を数字に置き換えた事によりできるようになったこと
- これらの数字を機械学習で訓練できる
- 人間の問題のように感情的にならないので客観的な議論ができる
不要なバイアスとは何をさすか
- 格差があること(異なるグループの間でのシステムの性能にさがある)
- 偏っている、と主張するには格差、性能、AIシステムを「定義」しなくてはいけない
手順
- ベースラインとなるデータセットで訓練を行う
- それぞれの数字の正解率を見る
- MAXスコアとMINスコアの差を測って「偏り」を定義する
- 別なデータセットで同じモデルを評価して「偏り」は本当にあるかを確かめる
- 別なデータセットで再訓練を行い偏りをなくす

つまりこの実験は数字を人に見立てて、その属性(1,2,3,4などの分類、オレンジか青か、直線的か曲線的か)を人種や性別などのカテゴリグループに見立てて、機械学習のモデルが「公平に」結果を導くにはどう考えたらよいか、という思考実験です。

例えばこのまま与えられたデータセットでベーストレーニングを行うとこうなりました。

評価データは各属性、全て平等に揃っていることを確認しているのですが、結果「0」と「1」のスコアが高く「3」と「5」のスコアが低いです。

これを先程のシナリオに当てはめると「0さんと1さんはすんなりアクセスできるライブラリに3さんと5さんはなぜかアクセスを拒否されることが多い」となります。

ここでマネージャーとしてこれは「公平性」を欠いているのか、つまりバイアスがかかっているのか、を検討する、というワークショップになります。

答えがでないことは事前に告知されていましたが、その中でも一定の成果は導き出すことができ、ほっとしています。

またこういったバイアスについての考え方は非常に重要で合理的だと思いました。偏りがあるから、じゃあ駄目なのか、と言う前に、その偏りを「定義」するところからはじめると思考がクリアになる、という経験をしました。非常に有意義なワークショップでした。