【新サービス】セルフサービスでドキュメント翻訳ができる Translation Hub が発表されたので、早速試しました! #GoogleCloudNext
ウィスキー、シガー、パイプをこよなく愛する大栗です。
現在開催中の Google Cloud Next '22 でドキュメント翻訳をセルフサービスで行えるサービスが発表されたのでレポートします。
Translation Hub
Translation Hub は数回のクリックでドキュメントの翻訳を実施できます。Google のニューラル機械翻訳に基づき 135 言語へワンクリックで翻訳を行えます。Translation Hub は元のドキュメントのデザインとフォーマットを維持するので、翻訳されたドキュメントは元のドキュメントと同じルックアンドフィールになります。
Translation Hub は複雑なエンタープライズの翻訳を念頭に置き開発されました。Translation Hub ではセントラルの管理者が様々な部門へ複数のポータル構成をかんたんに管理できます。様々な部門が使用する、一般的な翻訳の用語集、翻訳メモリ、独立した請求とチャージバックを維持できます。また、Translation Hub は完全なデータ暗号化を提供し、いかなる目的でも Google が使用やアクセスをすることはありません。
料金ティア
Translation Hub は GA されている Basic ティアと、Preview の Advanced ティアの2種類の料金ティアがあります。
機能 | Basic | Advanced |
---|---|---|
Google Cloud Console による管理コントロール | Yes | Yes |
PDF、DOCX、および PPTX の翻訳 | Yes | Yes |
Google Docs と Slides | Yes | Yes |
翻訳テンプレート | Yes | Yes |
用語集のサポート | Yes | Yes |
翻訳メモリ | No | Yes |
AutoML Translation モデル(カスタムモデル)のサポート | No | Yes |
機械翻訳コンテンツの事後編集サポート | No | Yes |
機械翻訳品質予測(MTQP)スコア | No | Yes |
100以上の言語サポート | Yes | Yes |
各ティアの料金は以下になります。
ティア | 料金 |
---|---|
Basic | ページあたり $0.15 |
Advanced | ページあたり $0.50 |
割り当てと制限
Translation Hub では、以下の割り当てがプロジェクトに適用されます。割り当てを変更するには増加のリクエストを行って下さい。
割り当て | 値 |
---|---|
Translation Hub のポータル数 | 1,000 |
翻訳ジョブの同時実行数 | 無制限 |
1分間に翻訳できるページ数 | 無制限 |
Translation Hub では、次の使用量上限が適用されます。
使用量上限 | 値 |
---|---|
PDF の翻訳リクエスト | 1 ファイルあたり 300 ページ |
DOCX および PPTX の翻訳リクエスト | 1 ファイルあたり 20 MB |
ドライブからDocsやSlidesのファイルの取り込み | 1 ファイルあたり 10 MB |
ユーザーを一括でインポートするためのCSVファイルのサイズ | 1 回のインポートあたり 100 KB または 500 行 |
用語集の数 | 10,000 |
各用語集のエントリのサイズ | UTF-8 で 1024 バイト |
用語集ファイルの合計サイズ | UTF-8 で 1040 万 (10,485,760) バイト |
やってみた
実際にドキュメントを翻訳してみます。
Translation Hub では Cloud Translation API を使用するため、有効化していない場合には事前に有効化しておきます。
ポータルの作成
Cloud Console の上部の検索窓にTranslation Hub
と入力してTranslation Hub
を選択します(日本時間 2022 年 10 月 12 日 6 時現在で検証した環境ではメニューに Translation Hub はありませんでした)。
左メニューのPortal
(ポータル)を選択してCREATE PORTAL
(ポータルを作成)をクリックします。
Portal Display Name
(ポータルの表示名)に任意のポータル名を入力して、Pricing Tier
(料金ティア)でBasic
かAdvanced
を選択します。ここではAdvanced
を選択しました。追加機能が不要な場合にはBasic
を選択してください。そしてCREATE
(作成)をクリックします。
サービスアカウントの設定
作成したポータルの@gcp-sa-translationhub.iam.gserviceaccount.com
で終わるサービスアカウントをコピーします。
IAM ページに移動して、GRANT ACCESS
(アクセス権を付与)をクリックします。
New principals
(新しいプリンシパル)に Translation Hub のサービスアカウントを入力して、Role
(ロール)でTranslation Hub Portal User
(Translation Hub ポータル ユーザー)を選択して、SAVE
(保存)をクリックします。
ユーザーをポータルへ追加
Translation Hub の Users ページにアクセスしてADD USER
(ユーザーを追加)をクリックします。
ここではユーザーを個別に追加するのでAdd user's email
(ユーザーのメールアドレスを追加)を選択して、User Email
(ユーザーのメール)にユーザーのメールアドレスを入力して、Sign-in method
(ログイン方法)を選択します。ここでは Google アカウントでログインするためSign-in with Google
を選択します。Portals
(ポータル)でユーザーを追加するポータルを選択します。ADD
(追加)をクリックします。
ユーザーが追加されます。
ドキュメントの翻訳
Portals ページで作成したポータルをクリックします。
ポータルの URL をコピーします。
ユーザーに URL を伝えてブラウザでアクセスしてもらいます。Google アカウントでのログインを設定しているのでSign in with Google
をクリックします。
チェックボックスをチェックしてAGREE AND CONTINUE
をクリックします。
ドキュメントをドラッグ・アンド・ドロップするかファイルを選択してアップロードします。ここでは F1 Query: Declarative Querying at Scale の PDF ファイルをアップロードしてみます。
アップロードしたら、翻訳先言語でJapanese
を選択して、Translate
をクリックします。
数十秒待ちます。
このように、左にオリジナルドキュメント、右に翻訳済みドキュメントが表示されます。翻訳を編集する場合には右上のペンマークをクリックします。なお、翻訳後の編集は Advanced ティアのみで可能です。
ペンマークをクリックすると、翻訳前後が文ごとに左右に対比されて表示されます。編集する場合は、対象の文をクリックします。
文言を修正します。ここでは最初の文に修正
を追加しました。そしてSubmit
をクリックします。機械翻訳品質予測(MTQP)が表示されていることも分かります。
翻訳済みドキュメントを再作成します。修正
が追加されていることが分かります。
画像の配置なども、翻訳済みドキュメントで再現されていることが分かります。
右上のメニューから、Google Drive にエクスポートしたり、ダウンロードができます。
Google Drive にエクスポートしてみると以下の画面が表示されるので、Export
をクリックします。
Translation Hub と連携する Google アカウントを選択します。
ここで、『このアプリは Google で確認されていません』と表示されてしまいました。
安全な手続きではありませんが、詳細
をクリックして、cloud-translation-hubteam@google.com (安全ではないページ) に移動
をクリックします。(検証のために進んでいますが、皆さんは警告が出ている画面でキャンセルしてください)
このアプリで使用する Google ドライブ上の特定のファイルのみの参照、編集、作成、削除 です。
にチェックを入れて、続行
をクリックします。
保存するフォルダを選択してSelect
をクリックすると Drive に保存されます。
ファイルをダウンロードする場合は、ファイルを選択してDownload
をクリックします。
追加機能について
本エントリでは割愛しますが、追加機能を使用する場合は Translation Hub の Resources ページでADD RESOURCE
(リソースを追加)から、用語集、カスタムモデル、翻訳メモリを設定してポータルに割り当てます。
用語集
カスタムモデル
翻訳メモリ
さいごに
今まで PDF や Word、PowerPoint などのドキュメントを翻訳するには、テキストをコピーして翻訳するため手間がかかりました。Translation Hub ではドキュメントをそのまま翻訳でき、用語集やカスタムモデル、翻訳メモリなどを活用できます。そのため業界用語、社内用語などの専門用語を含むドキュメントの翻訳がスムーズになります。ユーザー管理も用意のため、エンタープライズ企業でのドキュメント翻訳に最適なサービスです。