[アップデート] Amazon PollyおよびAmazon Connectに新しい日本語の音声「Kazuha」「Tomoko」が追加されました

「Mizukiさんのニューラル音声対応まだかなぁ~」と待っていたら、思いがけないニューカマーがやってきました!
2023.02.08

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

みなさん、こんにちは!
福岡オフィスの青柳です。

Amazon Pollyで利用できる日本語の音声の種類 (話者) に「Kazuha」と「Tomoko」が追加されていることが確認できました!

Amazon Pollyの公式ドキュメントの更新履歴 (英語版) に、当アップデートが記載されています。
Document History for Amazon Polly - Amazon Polly

2023-02-09 追記:
本日、AWSの「What's new」でもアップデートについて周知されています。
Amazon Polly launches two new Japanese NTTS voices

また、自動アナウンスのテキスト読み上げでAmazon Pollyのテクノロジーを利用しているAmazon Connectにおいても、同様に「Kazuha」と「Tomoko」が使えるようになっています。

試しに聴いてみよう

早速ですが、追加された2種類の音声を試してみましょう。

マネジメントコンソールで「Amazon Polly」ページを開き、メニューから「テキスト読み上げ機能」を選択します。

「エンジン」の選択を「ニューラル」、「言語」の選択を「日本語」にした状態で、「音声」の選択を試みると、これまで選択可能だった「Takumi」「Mizuki」に加えて、新たに「Kazuha」「Tomoko」が選択可能になっています。

右上の「音声を聴く」ボタンを押すと、どのような音声なのか実際に聴くことができます。

私が聴いた印象ですが、「Kazuha」は従来の「Mizuki」よりも明るい感じ、「Tomoko」は少し落ち着いた感じがしました。(個人の感想です)

ちなみに、「Kazuha」「Tomoko」は漢字で表記すると「和葉」「智子」であるようです。
音声の種類を選択すると自動的にセットされる「入力テキスト」のサンプルを見ると、ちゃんと漢字で名前を名乗っているのです!

(「Takumi」と「Mizuki」はそれぞれ「たくみ」「ミズキ」なんですよね・・・)

「ニューラル」「スタンダード」の対応有無について

今回新たに追加された2種類の音声ですが、注意しておくべき点が一つあります。

Amazon Pollyの音声には「ニューラル」「スタンダード (標準)」の2種類の「エンジン」があります。

  • ニューラル: 新しいエンジンであり、従来の「スタンダード」に比べて自然な話し方ができる
  • スタンダード: Amazon Pollyサービス開始当初からある従来のエンジン

「ニューラル」と「スタンダード」は利用料金にも違いがあり、「ニューラル」の方が「スタンダード」よりも高い単価が設定されています。
料金 - Amazon Polly | AWS

今回追加された「Kazuha」「Tomoko」なのですが、いずれも「ニューラル」のみ指定できるようになっています。
(「スタンダード」を指定しようとすると、下図のように「サポートされていません」となってしまいます)

なお、従来の「Takumi」は「ニューラル」「スタンダード」の両方に対応、「Mizuki」は「スタンダード」のみの対応となっています。

日本語話者の各音声の仕様について整理しますと、下表のようになります。

音声 (名前) 性別 ニューラル スタンダード 備考
Takumi 男性 対応 対応
Mizuki 女性 非対応 対応
Kazuha 女性 対応 非対応 今回追加
Tomoko 女性 対応 非対応 今回追加

Amazon Connectで新しい音声を使う

確認したところ、Amazon Connectでも新しい音声「Kazuha」「Tomoko」が使えるようになっていました。

コンタクトフローに配置した「音声の設定」ブロックで、プロパティ画面の「音声」から「Kazuha」「Tomoko」が選択可能になっていることを確認しました。
(もちろん、新しい音声を設定したコンタクトフローを使ってAmazon Connect上で通話を行うと、Amazon Pollyと同様に「Kazuha」「Tomoko」の声でアナウンス (音声プロンプト) が流れることを確認しています)

なお、「音声の設定」ブロックで「Kazuha」「Tomoko」を選択すると、「発話スタイルを上書き」のチェックボックス、および「スタンダード(レガシー)」「ニューラル発話スタイル」のオプションボックスが変更不可能となっていて「ニューラル」で固定になります。

これは、Amazon Pollyの設定画面のところで説明した「新しい音声は『ニューラル』のみに対応している」という点によるものだと思います。

おわりに

これまで、Amazon PollyあるいはAmazon Connectを使ったサービスを構築する際に、「音声は女性の声にしたいけど、『スタンダード』エンジンしか選べないので自然さに欠ける」といったお悩みを持たれていた方は、意外と多いのではないかと思います。

待望の「Amazon Polly (あるいはAmazon Connect) の日本語話者で『女性』かつ『ニューラル』に対応した音声」が利用できるようになりましたので、表現の選択の幅がグンと広がりましたね!

皆さんも、是非、新しい「Kazuha」「Tomoko」を試してみてはいかがでしょうか。