Pollyで音声のイントネーションを調整する方法を教えてください

2021.11.11

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

困っていた内容

Amazon Polly のSSMLで「製品に関するお問い合わせ」というアナウンスを作成しています。

この「製品に関するお問い合わせ」の「お問い合わせ」部分のイントネーションを、「お問い合わせ物品」や「お問い合わせ内容」等の「お問い合わせ○○」のイントネーションに近い形になるように修正したいです。

SSMLでサポートされている様々なタグを試しましたが、期待するイントネーションにはなりませんでした。

「お問い合わせ○○」のイントネーションに近い形で修正する方法があれば教えてください。

それぞれのイントネーションの違い

以下の2つの例(例1、例2)を Polly のSSMLで編集を行い聞き比べると、例1よりも例2の方が「お問い合わせ」の部分のイントネーションが比較的自然な形で聞こえるように感じとれることが確認できます。

  • 例1:「製品に関するお問い合わせ」
<speak>製品に関するお問い合わせ</speak>

<Mizuki:女性>

<Takumi:男性>

  • 例2:「お問い合わせ物品」
<speak>お問い合わせ物品</speak>

<Mizuki:女性>

<Takumi:男性>

【検証】「お問い合わせ○○」に近い形のイントネーションに修正する方法

SSMLには発音仮名で発音をコントロールするx-amazon-pron-kanaタグがあります。

x-amazon-pron-kanaタグを活用することで、アクセントを直接かつ明示的に指定することが可能です。

以下の2つの例(例3、例4)では、「製品に関するお問い合わせ」について、上記で示した例2のイントネーションになるべく近い形になるようにアレンジした例になります。

例3よりも例4の方が「お問い合わせ」の部分のイントネーションが比較的自然な形で聞こえるように感じとれることが確認できます。

一方、女性声(Mizuki)と男性声(Takumi)でも聞こえ方が微妙に違うことも確認できます。

今回のケースでは、例4の女性声(Mizuki)が例2のイントネーションにある程度近い形であることが確認できます。

  • 例3:「製品に関するお問い合わせ」
<speak>製品に<phoneme alphabet="x-amazon-pron-kana" ph="カンスル">関する</phoneme><phoneme alphabet="x-amazon-pron-kana" ph="オトイアワセ">お問い合わせ</phoneme></speak>

<Mizuki:女性>

<Takumi:男性>

  • 例4:「製品に関するお問い合わせ」
<speak>製品に関する<phoneme alphabet="x-amazon-pron-kana" ph="オトイアワセ">お問い合わせ</phoneme></speak>

<Mizuki:女性>

<Takumi:男性>

【補足】音(発音)の聞こえ方について

今回は一例としてご紹介いたしましたが、音(発音等)はある人にとっては好ましい音でも、他の人にとっては違った感じで好ましくない音に聞こえる等主観的なものとなっています。

そのため、PollyのSSMLでの編集でサポートされている様々なタグを活用して、ぜひお気に入りのイントネーションなど試行錯誤してお試しいただければと思います。

参考資料