AWS再入門2022 AWS Amazon Transcribeについて

AWS再入門2022

川村咲

2022.02.16

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんにちは、川村です。

当エントリは弊社コンサルティング部による『AWS 再入門ブログリレー 2022』の 11日目のエントリです。

このブログリレーの企画は、普段 AWS サービスについて最新のネタ・深い/細かいテーマを主に書き連ねてきたメンバーの手によって、今一度初心に返って、基本的な部分を見つめ直してみよう、解説してみようというコンセプトが含まれています。

AWSをこれから学ぼう！という方にとっては文字通りの入門記事として、またすでにAWSを活用されている方にとってもAWSサービスの再発見や2022年のサービスアップデートのキャッチアップの場となればと考えておりますので、ぜひ最後までお付合い頂ければ幸いです。

では、さっそくいってみましょう。１１日目のテーマはAmazon Transcribeです。

Amazon Transcribeとは？

音声をテキストに変換してくれるサービスです。

リアルタイムの音声/録画された音声/録画されたビデオデータなどの変換が可能です。

特徴

Amazon Transcribeは、あらゆるアプリケーションにSpeech to Text機能を簡単に追加できる自動音声認識サービスです。Transcribeの機能により、音声入力の取り込み、読みやすくレビューしやすいトランスクリプトの作成、カスタマイズによる精度の向上、顧客のプライバシーを確保するためのコンテンツのフィルタリングを行うことができます。

Amazon Transcribe Features から翻訳

いくつかピックアップして機能を記載します。

カスタム語彙:専門用語など、通常では認識されない単語の登録機能

カスタム言語モデル:テキストデータを使用し、精度を上げる機能

話者ダイアリゼーション: それぞれの文章を誰が喋っていたか特定する機能

Amazon Transcribeは言語により利用できる機能が異なりますので利用する際は、利用したい機能が言語に対応しているかの確認が必要です。

サポートされている言語

チュートリアル

文字起こし方法は、S3へファイルアップロードでの方法などが可能です。

今回はS3を利用せず、Real-time transcriptionを利用して喋った内容の文字起こしをリアルタイムに実施してみます。

Amazon TranscribeのページからReal-time transcriptionを開きます
Language settingsのLanguageをJapanese,JP(ja-JP)へ変更
Start streamingをクリックして文字起こしを開始※ブラウザでマイク使用許可のポップアップが出たら、許可してください。
文字起こししてみたい内容を喋ってみる今回はClassmethod Leadership Principle（CLP）よりリーダーシップの部分の文字起こしをしてみます。
喋っている時にリアルタイムで文字起こしがされていきます。

原文

全ての社員がリーダーであるという考えのもとで、指示待ちや他責にならず自ら進んで前向きに行動し、周囲を巻き込み協力しあいながら、妥協せずに最高の結果が出るように尽力します。

結果