【Speech to Text】Transcribeが日本語に対応しました！【日本語音声を文字へ】

2019.11.22

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。コンサル部のKyoです。

Amazon Transcribeで日本語がサポートされましたので、検証してみました。

TranscribeはいわゆるSpeech to Textです。

今回対応したのは以下の7つの言語で、合計31の言語に対応しました。

Gulf Arabic, Swiss German, Hebrew, Japanese, Malay, Telugu, and Turkish languages

やってみる

Speech to textなので、元となる音声ファイルを準備します。

今回はSimple Recorderを利用し、私が読み上げを行ってみました。

注意点として、Simple Recorderのデフォルト設定では録音したファイルがm4aで保存されます。 Transcribeは現在m4a未対応なので、設定をmp3に変更してから録音しました。

テキストは以下です。

おはようございます。本日は晴天なり。本日は晴天なり。本日の気温は25度です。

mp3ファイルを任意のS3 bucketにアップロードします。この際に、ファイルのオブジェクトURLをメモしておきます。

あとはTranscribeの画面でCreate Jobを選択し、以下を入力します。

Job settings

項目	設定値
Name	今回はtest-job-1 としました
Language	Japanese(Japan)

Input data

項目	設定値
Input file location on S3	先ほどメモしたオブジェクトURL
Format	mp3

実行すると1-2分で結果が表示されました。

数字を含めてかなり正確に文字起こし出来ていることがわかります。 "気温"が"基本"になってしまいましたが、これは滑舌の問題かもしれません…。

Mac にはsayというコマンドがあり、Macにおしゃべりしてもらう事が出来るようです。 ※macOS 10.14.6でデフォルトで使用可能でした。

say "おはようございます。本日は晴天なり。本日は晴天なり。本日の気温は25度です。"

これもTranscribeで処理してみました（ファイル以外の設定は同じ）。

おしい！気温"は" ではなく、気温"が" になってしまいました。

日本語でのSpeech to Textが出来るようになったことで、様々なサービスとの連携が予想されます。まず思いつくのはConnectとの連携でしょうか。

以上、何かのお役に立てれば幸いです。