Amazon Transcribeの利用費を計算してみた

Amazon が提供する文字起こしサービス Amazon Transcribe のランニングコストを計算してみました。
2018.05.03

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Amazon が提供する文字起こしサービス Amazon Transcribe のランニングコストを計算してみました。

AWS のコストと使用状況レポート(以下 CUR) での出力も実際に確認してみます。

料金体系

3行まとめ

  • 文字起こしするメディアの長さをもとにした従量課金
  • 毎月、1時間分は無料で利用可能
  • メディアの種類・文字起こし方式による単価の違いはない

詳細

1 秒あたり 0.0004 USD の費用が発生します。

15 秒未満のリクエストについては 15 秒分の料金が発生します。 例えば、10秒のコマーシャルを文字起こしすると、15秒分課金されます。

サービスを利用するリージョンによる単価の違いはありません。

メディアの形式(オーディオ、ビデオ)や文字起こし方式(話者の識別)による単価の違いはありません。

CUR での出力

詳細な利用状況を把握できる CUR での出力を確認します。

CUR の基本的な出力は把握していることを前提に、重要な箇所だけを抜粋します。

lineItem/LineItemType lineItem/Productcode lineItem/UsageType lineItem/Operation lineItem/ResourceId lineItem/UsageAmount lineItem/UnblendedRate lineItem/UnblendedCost lineItem/LineItemDescription
Usage transcribe USE1-TranscribeAudio TranscribeAudio en-US-mp4-44100-10.0078 15 0.0004000000 0.0060000000 Processed transcription request in us-east-1
Usage transcribe USE1-TranscribeAudio TranscribeAudio en-US-mp3-44100-128.548571 257.097142 0.0004000000 0.1028388568 Processed transcription request in us-east-1
Usage transcribe USE1-TranscribeAudio TranscribeAudio en-US-mp3-44100-128.548571 257.097142 0.0000000000 0.0000000000 Processed transcription request in us-east-1 - free tier

※ リージョンは北部バージニア

「lineItem/ResourceId」は「{言語}-{ファイル形式}-{サンプリングレート}-{長さ(秒)}」を表しているものと思われます。

1行目の「en-US-mp4-44100-10.0078」の場合

  • 言語:「アメリカ英語(en-US)」
  • ファイル形式 : mp4
  • サンプリングレート : 44100
  • 長さ : 10.0079(秒)

という具合です。

「lineItem/UsageAmount」が料金計算に利用されるメディアの長さです。

1行目の場合、オリジナルメディアの長さは10秒程度ですが、15 秒未満のリクエストについては 15 秒分の料金が発生するため、15秒となっています。

処理が無料枠で行われたか否かによって LineItemDescription の表記が微妙に異なっています。 無料枠で処理された場合 " - free tier" の文字が確認できます。 無料ラインでは、 「lineItem/UnblendedRate」(やコスト)は $0 となっていますね。

試算

毎日60分の音源を文字起こしする場合の1ヶ月の利用費を考えます。

Transcribe 利用費

1ヶ月あたりの文字起こし時間は 30 day * 60 min/day = 1800 min

毎月60分までの利用は無料となるため、課金対象の時間は 1800-60 = 1740 min

単価は 0.0004 USD/sec のため、1ヶ月の利用費は約$40となります。

1740 min * 60 sec/min * 0.0004000000 USD/sec = $41.76

"transcribe" で Google 検索した時に、トップに広告表示されたサービス(Rev)の利用費は $1/min でした。

仮にこのサービス(Rev)を利用すると、月に $1/min * 1800 = $1800 かかります。

Amazon Transcribe を利用すれば、約97% のコストカットとなります。

S3 利用費

Amazon Transcribe は文字起こし対象のメディアを S3 に保存します。

仮に、古いメディアは適宜削除しつつ、常に 100 GB ほど S3 標準ストレージで利用する場合、利用費は 100 GB * 0.025 USD/GB = $2.5 となります。

まとめ

Amazon Transcribe の運用費を計算してみました。

  • Amazon Transcribe は従量課金です。
  • 毎日60分程度の文字起こしする場合、利用費は $50/月 程度となります。
  • 単純に時間あたりの利用費だけを考慮すると、クラウド型文字起こしサービス Amazon Transcribe の利用費は既存の類似サービスに対して破壊的な安さで利用可能です。

なお 2018/05/02 時点では AWS 簡易見積りツールは Amazon Transcribe に対応しておりません。

参考

  • https://aws.amazon.com/transcribe/pricing/
  • https://aws.amazon.com/s3/pricing/