【Speech to Text】Transcribeが日本語に対応しました!【日本語音声を文字へ】

152件のシェア(すこし話題の記事)

こんにちは。コンサル部のKyoです。

Amazon Transcribeで日本語がサポートされましたので、検証してみました。

TranscribeはいわゆるSpeech to Textです。

Amazon Transcribe Now Supports Speech-to-text in 7 Additional Languages

今回対応したのは以下の7つの言語で、合計31の言語に対応しました。

Gulf Arabic, Swiss German, Hebrew, Japanese, Malay, Telugu, and Turkish languages

やってみる

Speech to textなので、元となる音声ファイルを準備します。

今回はSimple Recorderを利用し、私が読み上げを行ってみました。

注意点として、Simple Recorderのデフォルト設定では録音したファイルがm4aで保存されます。 Transcribeは現在m4a未対応なので、設定をmp3に変更してから録音しました。

テキストは以下です。

おはようございます。本日は晴天なり。本日は晴天なり。本日の気温は25度です。

mp3ファイルを任意のS3 bucketにアップロードします。 この際に、ファイルのオブジェクトURLをメモしておきます。

あとはTranscribeの画面でCreate Jobを選択し、以下を入力します。

Job settings

項目 設定値
Name 今回はtest-job-1 としました
Language Japanese(Japan)

Input data

項目 設定値
Input file location on S3 先ほどメモしたオブジェクトURL
Format mp3

実行すると1-2分で結果が表示されました。

数字を含めてかなり正確に文字起こし出来ていることがわかります。 "気温"が"基本"になってしまいましたが、これは滑舌の問題かもしれません…。

おまけ

Mac にはsayというコマンドがあり、Macにおしゃべりしてもらう事が出来るようです。 ※macOS 10.14.6でデフォルトで使用可能でした。

say "おはようございます。本日は晴天なり。本日は晴天なり。本日の気温は25度です。"

これもTranscribeで処理してみました(ファイル以外の設定は同じ)。

おしい! 気温"は" ではなく、気温"が" になってしまいました。

終わりに

日本語でのSpeech to Textが出来るようになったことで、様々なサービスとの連携が予想されます。まず思いつくのはConnectとの連携でしょうか。

以上、何かのお役に立てれば幸いです。