【レポート】Amazon Translateの紹介:ニューラル機械翻訳 #reinvent #mcl209

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

ウィスキー、シガー、パイプをこよなく愛する大栗です。

本記事はAWS re:Invent 2017のセッション「MCL209 - NEW LAUNCH! Introducing Amazon Translate – Now in Preview」のレポートです。

登壇者

登壇者は以下の4名です。

  • Yoni Friedman - Sr. Product Manager, Amazon Web Services
  • Vikram Anbazhagan - Head of Product - Language Technologies
  • Daniel Marcu - Director, Machine Translation/NLP, Amazon
  • Andrea Walsh - Chief Information Officer, Isentia

レポート

ほとんどのお客様は1言語しか話せない。

Amazonの機械翻訳

成長と国際的な拡大の鍵

様々なユースケースを含む膨大なボリューム

  • 製品リスト、説明; 検索クエリ
  • ウェブサイトの文字列と機能的なコンテンツ
  • 言語横断的なコミュニケーション:カスタマーサポート、ベンダー、セラー
  • 製品ドキュメントとサポート内容

ニューラル機械翻訳

現在AWSの顧客は利用可能

Amazon.deのポケットナイフ

87このツールと141機能

レビューをオープンソースの翻訳エンジンに書けると様々な問題が出る。

Amazon Translateでは適切に翻訳できる。

これを誰が使うべきか?

今日あなたのビジネスで使う言語以外の言語を話す顧客を持つ全てのビジネス

  • Hello
  • Hola
  • Bonjour
  • مرحبا‬
  • Hallo
  • 你好
  • Olá
  • ハロー
  • नमस्ते

大量で時間に敏感な情報に対して使用する

  • 機械翻訳
    • ユーザーが作成したコンテンツ
    • テキスト分析
    • リアルタイムコミュニケーション
    • コンテンツの発見
  • 機械翻訳の後に編集
    • 法的文書
    • ヘルスケア文書
    • 広告資料

Amazon Translateの検証

ニューラルモデル vs 統計モデル

英語:NMT yields high-quality translations

  • ニューラルアーキテクチャ
    • エンコーダ デコーダ
    • 畳み込み
    • 変換器

スペイン語:NMT produce traducciones de alta calidad

科学の利点 - 科学の利点 - 長期にわたる困難を乗り越えるための新しいツール

•データの希薄さ •コンテキスト •言語間の知識の活用 •他のマルチメディアとの統合 •特徴選択の消滅

顧客の利点

2015年7月はSMT(統計翻訳)より翻訳精度が低かったが、2017年11月には翻訳精度と流暢さの2桁%の改善(言語の組み合わせによって異なる)

将来の研究

  • 高品質のNMT(ニューラル機械翻訳)
  • より広い言語カバレッジ
  • 他のAIサービス(例えば、音声翻訳)との深い統合

Amazon Translateのサンプルアプリケーション

ストリーミングテキストのリアルタイム翻訳

Twitchのチャットのリアルタイム翻訳

ユーザーが作成したテキストのオンデマンド変換

チャットボットの翻訳

IsentiaとAmazon Translate

Isentiaはメディアインテリジェンスビジネスのリーダー的存在

自動翻訳にAmazon Translateを利用して、プロフェッショナルに人間の翻訳を利用している

Amazon Translateはプレビュー可能

プレビュー機能

  • 12の言語ペアがプレビュー
  • 任意のプレーンテキスト入力を翻訳
  • リアルタイム翻訳
  • 言語検出

使いやすく統合が容易

  • コマンドラインツールまたはAWS SDKを使用
  • アプリケーションに統合するか、外部で呼ぶ
  • Pythonの例:
import boto3

Amazon.translate = boto3.client(service_name=‘translate', region_name='region',
    endpoint_url='endpoint', use_ssl=True) result = Amazon.translate(Text="Hello, World", 
    SourceLanguageCode="en", TargetLanguageCode="de")
print('TranslatedText: ' + result.get('TranslatedTex42t'))

料金

  • プレビュー中は無料
  • 100 万文字あたり 15 USD(ローンチ後):サインアップ費用なし、最低料金なし
  • 毎月200万文字は無料:最初の翻訳リクエストを作成した日から12か月間

AWSセキュリティ標準

  • SSL暗号化
  • AWS Identity and Access Management (IAM)
  • 保存時にセキュアなストレージを使用
  • さらに登場する

Amazon Translateはあなたが何を作るのに役立ちますか?

さいごに

Amazon Transcribeと連携させると音声をリアルタイム翻訳してくれそうです。

プレビューでは英語からアラビア語、簡体字中国語、フランス語、ドイツ語、スペイン語、ポルトガル語に対応します。1億人以上のネイティブスピーカーがいる言語で対応していないのはヒンディー語、ベンガル語、ロシア語、日本語です。GA時には対応言語が増えるとFAQに記載があるので、この言語のいずれかは対応されると思われます。日本語の対応を待ちましょう。