ちょっと話題の記事

【新サービス】セルフサービスでドキュメント翻訳ができる Translation Hub が発表されたので、早速試しました! #GoogleCloudNext

セルフサービスで PDF や Word を翻訳できるし、用語集や Auto ML のモデルも活用できます

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

ウィスキー、シガー、パイプをこよなく愛する大栗です。

現在開催中の Google Cloud Next '22 でドキュメント翻訳をセルフサービスで行えるサービスが発表されたのでレポートします。

Translation Hub

Translation Hub は数回のクリックでドキュメントの翻訳を実施できます。Google のニューラル機械翻訳に基づき 135 言語へワンクリックで翻訳を行えます。Translation Hub は元のドキュメントのデザインとフォーマットを維持するので、翻訳されたドキュメントは元のドキュメントと同じルックアンドフィールになります。

Translation Hub は複雑なエンタープライズの翻訳を念頭に置き開発されました。Translation Hub ではセントラルの管理者が様々な部門へ複数のポータル構成をかんたんに管理できます。様々な部門が使用する、一般的な翻訳の用語集、翻訳メモリ、独立した請求とチャージバックを維持できます。また、Translation Hub は完全なデータ暗号化を提供し、いかなる目的でも Google が使用やアクセスをすることはありません。

料金ティア

Translation Hub は GA されている Basic ティアと、Preview の Advanced ティアの2種類の料金ティアがあります。

機能 Basic Advanced
Google Cloud Console による管理コントロール Yes Yes
PDF、DOCX、および PPTX の翻訳 Yes Yes
Google Docs と Slides Yes Yes
翻訳テンプレート Yes Yes
用語集のサポート Yes Yes
翻訳メモリ No Yes
AutoML Translation モデル(カスタムモデル)のサポート No Yes
機械翻訳コンテンツの事後編集サポート No Yes
機械翻訳品質予測(MTQP)スコア No Yes
100以上の言語サポート Yes Yes

各ティアの料金は以下になります。

ティア 料金
Basic ページあたり $0.15
Advanced ページあたり $0.50

割り当てと制限

Translation Hub では、以下の割り当てがプロジェクトに適用されます。割り当てを変更するには増加のリクエストを行って下さい。

割り当て
Translation Hub のポータル数 1,000
翻訳ジョブの同時実行数 無制限
1分間に翻訳できるページ数 無制限

Translation Hub では、次の使用量上限が適用されます。

使用量上限
PDF の翻訳リクエスト 1 ファイルあたり 300 ページ
DOCX および PPTX の翻訳リクエスト 1 ファイルあたり 20 MB
ドライブからDocsやSlidesのファイルの取り込み 1 ファイルあたり 10 MB
ユーザーを一括でインポートするためのCSVファイルのサイズ 1 回のインポートあたり 100 KB または 500 行
用語集の数 10,000
各用語集のエントリのサイズ UTF-8 で 1024 バイト
用語集ファイルの合計サイズ UTF-8 で 1040 万 (10,485,760) バイト

やってみた

実際にドキュメントを翻訳してみます。

Translation Hub では Cloud Translation API を使用するため、有効化していない場合には事前に有効化しておきます。

ポータルの作成

Cloud Console の上部の検索窓にTranslation Hubと入力してTranslation Hubを選択します(日本時間 2022 年 10 月 12 日 6 時現在で検証した環境ではメニューに Translation Hub はありませんでした)。

左メニューのPortal(ポータル)を選択してCREATE PORTAL(ポータルを作成)をクリックします。

Portal Display Name(ポータルの表示名)に任意のポータル名を入力して、Pricing Tier(料金ティア)でBasicAdvancedを選択します。ここではAdvancedを選択しました。追加機能が不要な場合にはBasicを選択してください。そしてCREATE(作成)をクリックします。

サービスアカウントの設定

作成したポータルの@gcp-sa-translationhub.iam.gserviceaccount.comで終わるサービスアカウントをコピーします。

IAM ページに移動して、GRANT ACCESS(アクセス権を付与)をクリックします。

New principals(新しいプリンシパル)に Translation Hub のサービスアカウントを入力して、Role(ロール)でTranslation Hub Portal User(Translation Hub ポータル ユーザー)を選択して、SAVE(保存)をクリックします。

ユーザーをポータルへ追加

Translation Hub の Users ページにアクセスしてADD USER(ユーザーを追加)をクリックします。

ここではユーザーを個別に追加するのでAdd user's email(ユーザーのメールアドレスを追加)を選択して、User Email(ユーザーのメール)にユーザーのメールアドレスを入力して、Sign-in method(ログイン方法)を選択します。ここでは Google アカウントでログインするためSign-in with Googleを選択します。Portals(ポータル)でユーザーを追加するポータルを選択します。ADD(追加)をクリックします。

ユーザーが追加されます。

ドキュメントの翻訳

Portals ページで作成したポータルをクリックします。

ポータルの URL をコピーします。

ユーザーに URL を伝えてブラウザでアクセスしてもらいます。Google アカウントでのログインを設定しているのでSign in with Googleをクリックします。

チェックボックスをチェックしてAGREE AND CONTINUEをクリックします。

ドキュメントをドラッグ・アンド・ドロップするかファイルを選択してアップロードします。ここでは F1 Query: Declarative Querying at Scale の PDF ファイルをアップロードしてみます。

アップロードしたら、翻訳先言語でJapaneseを選択して、Translateをクリックします。

数十秒待ちます。

このように、左にオリジナルドキュメント、右に翻訳済みドキュメントが表示されます。翻訳を編集する場合には右上のペンマークをクリックします。なお、翻訳後の編集は Advanced ティアのみで可能です。

ペンマークをクリックすると、翻訳前後が文ごとに左右に対比されて表示されます。編集する場合は、対象の文をクリックします。

文言を修正します。ここでは最初の文に修正を追加しました。そしてSubmitをクリックします。機械翻訳品質予測(MTQP)が表示されていることも分かります。

翻訳済みドキュメントを再作成します。修正が追加されていることが分かります。

画像の配置なども、翻訳済みドキュメントで再現されていることが分かります。

右上のメニューから、Google Drive にエクスポートしたり、ダウンロードができます。

Google Drive にエクスポートしてみると以下の画面が表示されるので、Exportをクリックします。

Translation Hub と連携する Google アカウントを選択します。

ここで、『このアプリは Google で確認されていません』と表示されてしまいました。

安全な手続きではありませんが、詳細をクリックして、cloud-translation-hubteam@google.com (安全ではないページ) に移動をクリックします。(検証のために進んでいますが、皆さんは警告が出ている画面でキャンセルしてください)

このアプリで使用する Google ドライブ上の特定のファイルのみの参照、編集、作成、削除 です。にチェックを入れて、続行をクリックします。

保存するフォルダを選択してSelectをクリックすると Drive に保存されます。

ファイルをダウンロードする場合は、ファイルを選択してDownloadをクリックします。

追加機能について

本エントリでは割愛しますが、追加機能を使用する場合は Translation Hub の Resources ページでADD RESOURCE(リソースを追加)から、用語集、カスタムモデル、翻訳メモリを設定してポータルに割り当てます。

用語集

カスタムモデル

翻訳メモリ

さいごに

今まで PDF や Word、PowerPoint などのドキュメントを翻訳するには、テキストをコピーして翻訳するため手間がかかりました。Translation Hub ではドキュメントをそのまま翻訳でき、用語集やカスタムモデル、翻訳メモリなどを活用できます。そのため業界用語、社内用語などの専門用語を含むドキュメントの翻訳がスムーズになります。ユーザー管理も用意のため、エンタープライズ企業でのドキュメント翻訳に最適なサービスです。