[新機能] Amazon Pollyに新たなSSMLタグ「vocal-tract-length」が追加されました

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

今日の新機能はこちら!

Amazon Pollyに新たなSSMLタグ

<amazon:effect vocal-tract-length>

が追加されました。「Vocal tract length」=声道長です。声道とは、音が発される器官から音が体外に放たれる器官で、声道長はその長さです。人間の声の場合は喉から口ですね。声はこの声道長によって変化します。子供が大人になると声が変わるのは、成長によって声道長が長くなるからです。

今回追加されたvocal-tract-lengthを調整することで、声色を変更することができます。

やってみた

vocal-tract-lengthの指定の仕方は2種類あります。

相対値で指定

+n%、または-n%と指定すると、現在の声に相対して声道長を変更します。標準は100%なので、+10%と指定すると110%になり、-10%と指定すると90%になります。なお有効値の範囲は+100%〜-50%です。つまり絶対値で言えば200%〜50%が有効値の範囲です。

<speak>
標準です。
<amazon:effect vocal-tract-length="+50%">プラス50%にします。</amazon:effect>
<amazon:effect vocal-tract-length="+100%">プラス100%にします。</amazon:effect>
<amazon:effect vocal-tract-length="+110%">プラス110%にしても有効値範囲外なのでプラス100%と同じです。</amazon:effect>
<amazon:effect vocal-tract-length="-50%">マイナス50%にします。</amazon:effect>
<amazon:effect vocal-tract-length="-100%">マイナス100%にしても有効値範囲外なのでマイナス50%と同じです。</amazon:effect>
</speak>

絶対値で指定

n%と指定すると、絶対値で声長道が変更されます。110%と指定すると声道長さは110%で設定されます。

<speak>
<amazon:effect vocal-tract-length="100%">標準です。</amazon:effect>
<amazon:effect vocal-tract-length="150%">150%にします。</amazon:effect>
<amazon:effect vocal-tract-length="200%">200%にします。</amazon:effect>
<amazon:effect vocal-tract-length="50%">50%にします。</amazon:effect>
</speak>

prosodyタグとの組み合わせ

prosodyタグではvolume、rate、pitchが変えられますので、声道長と組み合わせることで、一番聞き取りやすい声を作り上げることが可能です。

<speak> 
標準です。
<amazon:effect vocal-tract-length="-50%">マイナス50%にします。</amazon:effect>
<amazon:effect vocal-tract-length="-50%"> <prosody pitch="x-high">マイナス50%でピッチを上げます。
<prosody rate="x-fast">更に早口にします。</prosody></prosody></amazon:effect>  

<amazon:effect vocal-tract-length="+50%">プラス50%にします。</amazon:effect>
<amazon:effect vocal-tract-length="+50%"> <prosody pitch="x-low">プラス50%でピッチを下げます。
<prosody rate="x-slow">更にゆっくりにします。</prosody></prosody></amazon:effect>
</speak>

さいごに

AWS re:Invent前にPollyのアップデートが来ました。re:Inventでは他のアップデートもあるのかもしれませんね。楽しみです。