AWS再入門ブログリレー Amazon Translate編

2020.08.21

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、たぬき( @tanuki_tzp )です。
当エントリは弊社コンサルティング部による『AWS 再入門ブログリレー 2020』の 14 日目のエントリです。

このブログリレーの企画は、普段 AWS サービスについて最新のネタ・深い/細かいテーマを主に書き連ねてきたメンバーの手によって、 今一度初心に返って、基本的な部分を見つめ直してみよう、解説してみようというコンセプトが含まれています。
AWS をこれから学ぼう!という方にとっては文字通りの入門記事として、またすでに AWS を活用されている方にとっても AWS サービスの再発見や 2020 年のサービスアップデートのキャッチアップの場となればと考えておりますので、ぜひ最後までお付合い頂ければ幸いです。

では、さっそくいってみましょう。 14 日目のテーマは『Amazon Translate』です。

Amazon Translateとは

概要

サービス名通り、Amazon Translate は自動言語翻訳サービスです。
ディープラーニングを使用しています。
主な特徴は以下です。
- 55種類の言語に対応 (2020/8/21現在) - 文字コードはUTF-8 - 独自の単語を"カスタム用語"として設定できる - 他のAWSサービスと連携できる - 翻訳タイミングを非同期バッチとリアルタイムで選択できる

東京リージョンで利用できるようになったのは2019年5月なので、まだ比較的新しい機能かなと感じています。
Amazonの翻訳サービス Amazon Translate が日本に上陸!

コスト

Translate は従量課金制で、文字数によって課金されます。
現在、100 万文字あたり 15.00USD で提供されており、空白文字も課金対象に含みます。
また、無料利用枠が提供されており、翻訳をリクエストした日から12ヵ月間、1ヵ月 200万文字まで無料で使用することができます。

また、Traslate では自動で翻訳前のテキストの言語を判定する機能がありますが、Amazon Comprehend を使用しているため、別途 Comprehend の料金がかかります。

Amazon Translate と Amazon Comprehend

コストで触れたように、Translate の翻訳前のテキストの自動言語判定は Comprehend が使用されます。
Translate の自動言語判定の機能を使用した場合、Comprehend も契約したことになりますので、ご注意ください。
Amazon Comprehend

非同期バッチ翻訳とリアルタイム翻訳

翻訳するタイミングを選択することができ、それぞれ以下のような特徴があります。

リアルタイム翻訳

  • 東京リージョン対応
  • 翻訳結果を直接アプリケーションに返す
  • 使用するAPI : TranslateText

↓使用イメージ

非同期バッチ翻訳

  • 東京リージョン非対応
  • S3 バケットに配置した、最大5GB のファイルを複数まとめて翻訳できる
  • 対応しているファイル形式は txt、html、docx、pptx、xlsx の5種類
  • S3 バケットと Traslate のリージョンを合わせることが必要
  • S3 バケットに Translate のアクセス許可と Translate のサービスロールへポリシー適応が必要
  • 使用するAPI : StartTextTranslationJob

↓使用イメージ

対応しているファイル形式に docx、pptx、xlsx が追加されたのは 2020/7/29 です。
私は元運用で Excel 手順書などをよく見ていたので、アップデートされたときに『手順書をまとめて翻訳できるの便利だなー』と思いました。
[アップデート] Amazon Translate で Office Open XML ドキュメントの翻訳が可能になりました

翻訳機能を試す

とにかくリアルタイム翻訳してみる

他のAWSサービスと連携する前にサクッとリアルタイム翻訳機能を使用してみましょう。
コンソールにログインしてAmazon Translateを開きます。
今回は東京リージョンを選択しています。

ソース言語とターゲット言語を指定し、翻訳したい文字をソース言語の方に入力します。
入力した文字が即時で翻訳され、ターゲット言語側のウィンドウに表示されます。

ちゃんと意味が通じるように翻訳されているか確かめるため、ソース言語とターゲット言語を入れ替えて再翻訳してみました。
翻訳前後で意味はほぼ同一です。

※東京リージョンのコンソールでは、非同期バッチ翻訳は表示されていませんが、対応しているリージョン (画面はバージニア北部) を選択するとちゃんと表示されます。

AWS CLIからTranslateをサクッと利用する手順は以下の記事にまとめられていますので、ご参照ください。
初めてのAmazon TranslateとAWS CLIでの利用方法

他のサービスと連携して使う

Translateと他のサービスを連携して、使用している例をご紹介します。

Amazon Translate を使った翻訳 LINE Bot を作ってみた

サーバーレス入門!英語の音声ファイルをTranscribeで文字起こししてTranslateで日本語に翻訳する #jawsug_bgnr

おわりに

Amazon Translateについて、いかがでしたでしょうか?
まだ東京リージョンでは非同期バッチ翻訳が使用できないものの、選択可能言語が大幅に増えているため、翻訳ツールとしての選択肢には上がりやすくなっていると思います。
また、他の翻訳ツールと改めて比較してみた記事もありますので、是非参考にしていただければ幸いです。
[小ネタ]Amazon Translate VS Im Translator VS DeepL 日本語訳を比較してみた

以上、『AWS 再入門ブログリレー 2020』の 14 日目のエントリ『Amazon Translate』編でした。
来週 (8/24) はもこさんの「Amazon ECS/AWS Fargate」の予定です。お楽しみに!!