[アップデート] Amazon PollyのNeural TTSが中国語に対応しました

より高品質な中国語の音声生成が可能になりました。
2022.08.24

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

大家好、AWS事業本部の西野です。

Amazon PollyのNeural TTSが中国語1に対応しました。

Amazon Polly now offers Neural TTS support for Mandarin Chinese

本アップデートによりAmazon Pollyは33言語・95種類の音声に対応することになりました2

本稿では中国語(Mandarin Chinese)のNeural TTSを試してみます。
Amazon PollyやNeural TTSの概要については本稿後半で紹介するドキュメントやブログをご参照ください。

やってみた

AWSの紹介

亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 26 个地理区域的 84 个可用区,并计划新建 8 个区域和 24 个可用区。

Standard (Zhiyu)

Neural (Zhiyu)

Pollyの紹介

Amazon Polly 是一项将文本转换为逼真语音的服务,借助该服务,您可以创建具有语音功能的应用程序,并构建各种全新的支持语音功能的产品。

该服务可以提供众多语言的几十种逼真语音,因此您可以选择最合适的语音,并构建适用于许多不同国家/地区的支持语音功能的应用程序。

Standard (Zhiyu)

Neural (Zhiyu)

绕口令(早口言葉)

四是四,十是十,十四是十四,四十是四十,十四不是四十,四十也不是十四。

Standard (Zhiyu)

Neural (Zhiyu)

感想

筆者は中国語の非ネイティブ話者・学習者です。
Standardで生成された音声を聞くと明らかな機械音声感があるものの、Neuralのそれにはほぼ違和感を覚えませんでした。
また、中国語ネイティブな妻にも聞かせてみたところ、「(TTSによって生成されたものだとは)ほぼわからない」とのことでした。

自宅で使っているロボット掃除機の音声設定を中国語にしているので、PollyのNeural TTSで生成された音声データにのせかえたい……。(無理)

おまけ: Zhiyuとは

Pollyの日本語で使えるボイスにはMizukiとTakumiの2種類があります。
中国語の場合はZhiyuです。

このZhiyuの漢字表記は「知语(知語)」です。文字通り、言葉を知るという意味ですね。 名付けにもこだわりが感じられて面白いです。

参考

What Is Amazon Polly?

[新サービス]テキスト読み上げサービス「Amazon Polly」がリリースされました! #reinvent

Amazon PollyのNeural TTSで日本語を選択出来るようになりました

[新機能] Amazon PollyがNeural TTSに対応しました

終わりに

このブログがほんの少しでも世界を良くできれば嬉しいです。
AWS事業本部の西野 (@xiyegen) がお送りしました。


  1. AWSの英語表記で言うとMandarin Chineseです。標準中国語(普通话)のことを指していると考えてだいたい問題ないはずです。詳しい方、こっそり教えて下さい! 
  2. 現在サポートされている音声の一覧はこちらです。