AWSを使って翻訳ツールを作ってみた ~インド新卒として日本の企業へ 入社した私の旅日記も添えて~

こんにちは、ゲーソルのチャールと申します。DevelopersIO 2023にAWSを使って翻訳ツールを作ってみたとインド新卒として日本の企業へ入社した私の旅日記も添えてについて話しましました。このブログでは、登壇資料の内容と、お客様からの質問を紹介します。

アジェンダ:

  • なぜ日本を選んだのか?
  • なぜクラスメソッドを選んだのか?
  • 日本語と文化差の学習
  • 私の学んだこと
  • Amazon Polly, Translate と Rekognition
  • これらのサービスを組み合わせて使用​​するメリット
  • お客様からの質問
  • 1. なぜ日本を選んだのか?

    私は新しいことにチャレンジし、コンフォートゾーンの外に自分を押し出したいと思いました。日本の文化にはいつも魅了されてきました。日本人はとても忠実で誠実だと思います。日本は技術が素晴らしいし、エンジニアとしてのキャリアも向上させることができます。だから日本を選びました。

    2. なぜクラスメソッドを選んだのか?

    多くの企業が私の大学に来ましたが、私はクラスメソッドの職場文化に感銘を受けました。クラスメソッドは私の知識だけでなく、私のやりたいことに対しても配慮してくれると感じました。また、柔軟な働き方ができることも魅力だと思いました。

    3. 日本語と文化差の学習:

    日本語を学ぶのは難しいことだったが、人々や文化とつながるためには必要不可欠なことだとすぐに気づいました。もともとアニメを少し見て、オンライン授業で日本語をべんきょうして学びました。おじぎやはしの使い方など、慣れ親しんだものとは異なる生活習慣に触れることができました。日本の料理はインドの料理と異なります。私は様々な日本食を試してみて、とても美味しいと感じています。私の好きな食べ物にはラーメンとたい焼きです。インドと日本は文化的価値観が似ていますが、日本は礼儀正しく、労働倫理が高いことで知られています。日本で働くことで、私は仕事面でも個人面でも成長することができました。

    4. 私の学んだこと:

    努力と決意があれば、どんな困難も乗り越えられることを学ぶことができました。新しい文化を受け入れ、新しい言語を学ぶことで、私は視野を広げ、個人的にも仕事上でも成長することができました。環境の変化は成長と発展のための大きなチャンスになりうると考えるようになりました。

    5. Amazon Polly:

    Amazon Pollyは革新的なテキストから音声への変換サービスであり、テキストの内容をリアルタイムまたはバッチ処理で効率的に音声に変換することが可能です。これは、複数の形式でオーディオファイルを生成でき、使用者のニーズに合わせて適応可能です。Pollyは豊かな声のバリエーションを提供し、SSMLタグを使用して音声の調整が可能です。また、Pollyは手軽なコストでアプリケーションにリアルな音声機能を追加することができ、これによりアプリケーションの体験が向上します。

    6. Amazon Translate:

    Amazon Translateは、最高レベルの精度とプライバシーを誇るテキスト翻訳サービスです。これはエンドツーエンドの暗号化を提供し、全ての情報が厳重に保護されることを保証します。Translateは大規模なテキストデータの効率的な翻訳に優れており、需要が高まる場合でも高い性能を維持します。また、AWSの他の製品との統合性も高く、データプライバシーを確保するための強固な暗号化機能を提供します。

    7. Amazon Rekognition:

    Amazon Rekognitionは、様々な画像やビデオから顔の検出と識別を可能にする強力な視覚分析ツールです。さらに、オブジェクト、シーン、およびアクティビティの識別も可能であり、視覚データの理解を深めることができます。Rekognitionの特筆すべき特徴の一つは、画像やビデオからテキストを抽出し、その情報を利用してビデオコンテンツを効率的にカタログ化し分析する能力です。これにより、ビジュアルコンテンツの管理と活用がより容易になります。

    8. これらのサービスを組み合わせて使用​​するメリット:

  • Rekognitionを使用してビデオコンテンツの中の顔を認識し、その情報を使ってPollyのテキスト読み上げサービスを起動することで、ビデオをより没入感のあるものにすることができます。
  • Rekognitionを使用して画像の中のオブジェクトを検出し、Translateを使用してそのオブジェクトの名前を異なる言語で表示します。
  • Rekognitionを使用して画像からテキストを抽出し、そのテキストをユーザーの好みの言語に翻訳します。
  • これら3つのサービスを使用してこのウェブアプリを作成しました。

    9. お客様からの質問:

  • Amazon Translateの文字数制限は何ですか?

    Amazon Translate のリアルタイムサービス呼び出しは、API コールごとに 5,000 バイトに制限されます。お客様が任意の長さのテキストを翻訳できるように大規模なドキュメントをセクションや段落に分割する方法が用意されています。Amazon Translate 非同期バッチ翻訳サービスは、API 呼び出しごとに最大 5 GB のサイズのバッチ (各ドキュメントのサイズが 1 MB を超えず、各ドキュメントの文字数が 100 万を超えず、バッチあたりの S3 バケットフォルダ内のドキュメント数が 100 万を超えない) を受け入れます。

    詳細については、こちらをご覧ください

  • Amazon Translateは他の翻訳プラットフォームと比較してどう優れていますか?

    Amazon Translateは他のプラットフォームよりも精度が高いです。また、「フォーマル」または「インフォーマル」な会話の翻訳オプションも提供しており、これはその最良の機能の一つだと感じています。

  • 自分のアプリケーションで各サービスのAPIを使用できますか?

    はい、できます。

  • Amazon Polly、Translate、Rekognitionの価格はいくらですか?

    価格は地域やサービスタイプによって異なり、AWSは新規顧客や低利用顧客に対してしばしば無料枠を提供しています。 参考のために、これらのリンクをご覧ください。

    Amazon Translate

    Amazon Polly

    Amazon Rekognition

  • Rekognitionは写真からテキストとオブジェクトの両方を抽出できますか?

    はい、できます。

  • 最後までお読みいただきありがとうございました。 詳細な情報については、私の他のブログを参照してくださいー

    Amazon Translate

    I tried Hands-on on Amazon Polly

    Amazon Rekognition introduction and demo