Contact Lens for Amazon Connectでカスタム語彙を追加してみた

Contact Lens for Amazon Connectの機能の一つにカスタム語彙の追加機能があります。カスタム語彙では、文字起こしした時に、誤認識される言葉をカスタム語彙に追加することで、正しく認識させることができます。
2023.02.24

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

Contact Lens for Amazon Connect(以降、Contact Lens)の機能の一つにカスタム語彙の追加機能があります。

Contacts Lensでは、Amazon Transcribeを利用した音声からテキストに変換する文字起こし機能がありますが、Amazon Transcribeが認識していない固有の言葉の場合、誤った変換がされることがあります。

その場合、固有の言葉をカスタム語彙として追加することで、認識向上につなげることができます。

ただし、カスタム語彙には、色々な制約がありますので、1度ドキュメントを確認することを推奨します

・分析に適用できる語彙は、1 言語につき 1 個です。つまり、準備完了 (デフォルト) のステータスになるファイルは、1 言語につき 1 個だけです。

・カスタム語彙は音声分析にのみ適用されます。トランスクリプトは既に存在するため、チャットの会話には適用されません。

カスタム語彙にアクセスするユーザー権限設定

セキュリティプロファイルにカスタム語彙の権限を付与したユーザーのみが、カスタム語彙設定にアクセスできます。

カスタム語彙を追加するために必要な権限は、以下の1点です。

  • Contact Lens - カスタム語彙

この権限を付与したユーザーのみが、Connectのコンソール画面の[分析と最適化]から[カスタム語彙]に遷移できますので、権限を付与しましょう。

カスタム語彙で追加する言葉

Contact Lensを利用して、文字起こしした内容を確認すると、うまく変換されていない住所がありました。

正式な住所(クラスメソッドの日比谷オフィス)

  • 東京都港区西新橋1-1-1 日比谷フォートタワー二十六階

ご認識した住所(5回試しました)

  • 東京都港区西新橋一の一の一、日々はトタワ二十六回
  • 東京都港区西新橋一の一の一、日々はトタワ二十六回
  • 東京都港区西新橋一の一の一、日々はトタワ二十六回
  • 東京都港区西新橋一の一の一、日比谷トタワ二十六回
  • 東京都港区西新橋一の一の一、日にちはトタワ二十六回
    • 実際の文字起こし内容

日比谷は「日々は」、フォートタワーは「トタワ」、二十六階は「二十六回」とご認識していますね。

以下の3つをカスタム語彙に追加し、文字起こしの認識を向上させたいと思います。

  • 日比谷
  • フォートタワー
  • 二十六階

カスタム語彙の追加方法

Connectのコンソール画面から、カスタム語彙の追加をクリックします。

テキストファイルをアップロードする箇所があります。 カスタム語彙を追加するためには、追加したい言葉をまとめたファイルをアップロードする必要があります。

[サンプルファイルをダウンロード]をクリックします

テキストファイルの書き方

サンプルファイルの中身を確認してみます。

Phrase	IPA	SoundsLike	DisplayAs
Los-Angeles			Los Angeles
F.B.I.	ɛ f b i aɪ		FBI
Etienne		eh-tee-en

サンプルファイルに記載されている4つのフィールドについてご説明します。

  • Phrase
    • 認識する単語
  • IPA (国際音声記号)
    • IPAの文字のみを使用した音声記号を指定
  • SoundsLike
    • ハイフンで区切られた音節として指定
  • DisplayAs
    • Phraseを文字出力を指定

PhraseDisplayAsでは、日本語のうち、以下の一覧に含まれている日本語のみを使用できます。 ja-jp-character-set.txt

また、制約もいくつかありますので、ファイルの記載方法を含め、ドキュメントを確認しましょう。

文字コードはUTF-8 テキストファイルのサイズは50KBが上限 テキストファイル内のエントリは256文字未満であること

色々な制約がありますが、4つのフィールドのうちPhraseに誤訳された言葉を指定し、DisplayAsに本来の言葉を指定するとよいです。

今回は、以下のように設定します。

Phrase	IPA	SoundsLike	DisplayAs
トタワ二[TAB][TAB][TAB]フォートタワー
日々は[TAB][TAB][TAB]日比谷
二十六回[TAB][TAB][TAB]二十六階

[TAB]は、スペースの意味ですので、見た目は以下になります。

Phrase	IPA	SoundsLike	DisplayAs
トタワ二			フォートタワー
日々は			日比谷
二十六回			二十六階

それでは、このテキストファイルをアップロードし、保存します。

ステータスが処理中から、数分で準備完了になります。その後にデフォルトとして設定をクリックすると、全てのコンタクトフローに影響されます。
現時点では、特定のコンタクトフローのみを選択はできません。

カスタム語彙で追加した言葉は認識されるようになるか確認

それでは、下記の住所をConnectで話し、正しく文字起こししてくれるか確認します

  • 東京都港区西新橋1-1-1 日比谷フォートタワー二十六階

5回試しましたが結果は、以下のようになりました。

  • 東京都港区西新橋一一一一日比谷フォートタワー二十六回
  • 東京都港区西新橋一の一の一、日比谷フォートタワー二十六回
  • 東京都港区西新橋一の一の一、日比谷フォフォートタワー二十六回
  • 東京都港区西新橋一の一の一、日比谷フォフォートタワー二十六回
  • 東京都港区西新橋一の一の一、日比谷フォフォートタワー二十六回

日比谷フォートタワーは、認識するようになりました! 二十六回は、二十六階と認識しなかったですね。。

今回は、2023年2月21日時点でのAmazon Transcribeの能力です。今後、認識能力が向上することで、今回のカスタム語彙に追加した言葉もインプット済みになる可能性があります。

利用する際は、検証しておくとよいでしょう。

参考記事