機械翻訳利用時の注意点とコツ

2023.10.24

前回「機械翻訳は人間を超えるのか」というテーマでブログを書かせていただきました。

昨今、急速に発達していくAIや機械翻訳において、活用しない手はありません。そこで今回は、機械翻訳を利用する際の注意点や、コツなどを書いていきたいと思います。

情報漏洩のリスク

無料の機械翻訳サイトはセキュリティの保証がないそうです。
翻訳サイトによってはユーザーが入力した情報を収集し、翻訳の精度を上げるためのデータとして活用することがあります。なので社内の機密情報や社外秘の文章を無料機械翻訳サイトで翻訳する際は、情報漏洩リスクを認識し利用することが大切です。

誤訳がなくなったわけではない

近年、機械翻訳の精度は日々向上していますが、機械翻訳も誤訳をすることがあります。(後記しますが)場合によっては大問題になりかねません。こうした問題がどこで発生するのか、発見された場合にどのタイミングで改善されるのかを予想することは難しく、そのリスクは常に考慮すべきものとなります。

ではどのように注意して機械翻訳を活用すればよいでしょうか。

翻訳前の日本語から見直す

正確な翻訳を行うためには、機械翻訳に原文を入力する前に、翻訳しやすい文章に変えることがポイントです。日本人独特の言い回しや、その業界だけで通じる単語等を使うと、思ったような文章に変換してくれません。また、機械翻訳の訳文が、原文のクオリティを上回ることはないので、翻訳後に文章を修正してもあまり意味がありません。したがって、元の文章を整える必要があります。

主な修正のコツは以下の通りです。

1.主語や代名詞を明確にする

機械翻訳の限界の一つに「代名詞照応(pronoun resolution)」があります。英語では代名詞を多用しますが、日本語では直接使うことは少ないことです。それに伴って、代名詞が何を指すのかをはっきりさせなければなりません。また、日本語は主語を省略しがちです。

<例>

「これ持ってきて」と言ったので「どこにあるの?」と聞いた

<google翻訳>

I said, "Bring me this," and I asked, "Where is it?''(が「これ持ってきて」と言ったので「どこにあるの?」とがたずねた。)

全部主語が「私」になってしまっています。「持ってきて」と言ったのは「私」かもしれないし「彼」かもしれないし、日本文だけではわかりません。「誰が」「誰に」「何を」がハッキリしている文章に整えましょう。

2.固有名詞にご注意

2019年、Twitterトレンドにもなった機械翻訳の誤訳例、「Sakai Muscle Line」をご存知でしょうか。

米Microsoftの自動翻訳ツールによる翻訳をそのまま掲載していたことが原因で、「堺筋線」(さかいすじせん)という路線名が「サカイマッスルライン」(堺筋肉線)と大阪メトロの英語サイトに掲載されていたそうです。(現在は正しい翻訳を返してくれています!)

機械翻訳は、膨大なデータベースをもとに適切な翻訳文を提供してくれます。しかし固有名詞や流行り言葉に関し、まだまだ網羅できていないところが多く、駅名・地名、人や企業名などが、上記の例のように大きく誤訳されてしまうことがあるので注意が必要です。

3.言葉と言葉の関係性を明確に

「主語と述語」「修飾語と被修飾語」のように、言葉には異なる語句が何かしらの補足説明を行う関係性があります。この関係性がはっきりしていないと、機械翻訳は細かいニュアンスを汲み取ることができず、意図しない翻訳をすることがあります。

(例)

●「きれいな沖縄に水族館があります」

「沖縄がきれいである」という解釈と「水族館がきれいである」という解釈です。筆者の意図とは関係なく。機械翻訳されてしまうので、「きれい」が何にかかっているかを明確にしなければなりません。

●「ここではきものを抜いてください」

「ここで はきもの(履物)」なのか「ここでは きもの(着物)」なのかわかりません。(ちなみにこの文章を機械翻訳したら「着物」の方で訳されました。)

4.1文をできるだけ短く、簡潔にする

機械翻訳は、文章が長くなれば長くなるほど精度が落ちると言われています。それは、これまでに述べてきたような名詞・代名詞、主語・述語、それに伴った言葉同志の関係性が。長くなれば長くなるほど曖昧になるからだと言えます。できるだけ「1センテンス、1トピック」を意識することで機械翻訳品質が安定します。

5.できあがった機械翻訳を鵜呑みにしない

海外旅行中などで困った時に利用する分にはこの必要はありません。多少変な文法やヘンテコな単語に訳されていたって、笑ってすませられるでしょう。

しかしながら公式文書や契約書、顧客との信頼性に関わるやり取りに関してはそうはいきません。そういった文書を取り扱う方で、英語が不得意な方や、文章を精査できない方は、背景・内容を理解した関係者や校正者にレビューをお願いすることをおすすめします。「その文書ごとにおける専門用語の正確性(Severityなど)が保たれているか」「翻訳対象の「その文書における正しい意味、内容」を正しく翻訳できているか」を確認する必要があるからです。

まとめ

機械翻訳の限界と人間による翻訳の可能性という論文に、面白い内容があったのでご紹介したいと思います。

言語学研究所所長でもある Thierry Poibeau(2017)は,ニューラル機械翻訳が今後急速に進歩することを指摘しつつも,翻訳の「自動システムが人間の翻訳に取って代わることはない。そのようなことは目標でもなければ望ましい結果ではない」(Poibeau 2017, 255)とはっきり断言している。特に,「取って代わることはない」という部分の原文は,”will, of course, not replace…”となっており,かなり強い断定の調子を持っている。

機械翻訳の第一人者がこう言っているのは驚きです。

機械翻訳は補完的なツールとして活用していき、重要性・機密性の高いものは人間の翻訳・通訳者を利用するなどして両立するのがよいと思いました。最後までお読みいただきありがとうございました。