[アップデート]Amazon Transcribeが30言語を新たにサポートしました
はじめに
かつまたです。
2024年10月17日ににAmazon Transcribeにおいて対応言語がアップデートされ新たに30言語が利用可能となりました。今回はそのアップデート内容の確認と、実際に使ってみた手順をご紹介します。
Amazon Transcribeとは
Amazon Transcribeは音声ファイルをテキスト変換することができるフルマネージド型の自動音声認識サービスです。この機能を用いてアプリケーションに音声の文字起こし機能を追加することができます。ユースケースとしてはストリーミングコンテンツの字幕機能などが考えられます。
アップデート内容
Amazon Transcribeにおいて以下30言語が新たにサポートされました
追加言語
アフリカーンス語、アムハラ語、アラビア語 (湾岸)、アラビア語 (標準) 、バスク語、カタロニア語、クロアチア語、チェコ語、デンマーク語、オランダ語、ペルシア語、フィンランド語、ガリシア語、ギリシャ語、ヘブライ語、インドネシア語、ラトビア語、マレー語、ノルウェー語、ポーランド語、ルーマニア語、ロシア語、セルビア語、スロバキア語、ソマリ語、スウェーデン語、タガログ語、ウクライナ語、ベトナム語、ズールー語
使ってみた
今回は新たに追加されたペルシア語の音声ファイルを用いて文字起こし機能を確認していきます。
1.音声ファイルをS3バケットにアップロードします。
2.「Amazon Transcribe」→「トランスクリプションジョブ」から「ジョブを作成」を選択します。
- ジョブ名と利用言語を設定し、「入力データ」で上記でアップロードしたS3バケット内の音声ファイルのオブジェクトを選択します。ジョブを作成します。
- ジョブの作成が完了後、ジョブ詳細の「トランスクリプションのプレビュー」上で文字起こしされたテキストを確認できます。
機械翻訳したところ「من چای را خیلی دوست دارم.」→「私はお茶が大好きです」と翻訳され、期待通りの挙動を確認できました!
おわりに
対応言語が大幅に増加したことで、アプリケーションがより広い範囲でグローバルにお客様に届き、ビジネスソリューションの手助けになると感じました。もちろん日本語にも対応しています!ぜひご活用ください。ご覧いただきありがとうございました。
アノテーション株式会社について
アノテーション株式会社はクラスメソッドグループのオペレーション専門特化企業です。サポート・運用・開発保守・情シス・バックオフィスの専門チームが、最新 IT テクノロジー、高い技術力、蓄積されたノウハウをフル活用し、お客様の課題解決を行っています。当社は様々な職種でメンバーを募集しています。「オペレーション・エクセレンス」と「らしく働く、らしく生きる」を共に実現するカルチャー・しくみ・働き方にご興味がある方は、アノテーション株式会社 採用サイトをぜひご覧ください。