ずんだもんの英単語読み入力をAIで賄ってみる #ChatGPT

ずんだもん、もといVOICEBOX用に英単語の日本語読み表記を自動生成できないかとAIに頼ってみました。
2023.08.15

テキスト読み上げ系アプリケーションをなんとなく触り始めました。YouTubeの解説動画を見ていると、聴き取りも行うことで理解に至るまでの速さが増している実感もあり、音声起こしされていないテキストを自身で音声にしてみようと思ったのがきっかけです。動画編集アプリを併用しての動画作成もありかなと思っています。

使っているのはVOICEBOXのずんだもん。商用フリーなのでDevIOにも気兼ねなく活用できる点がメリットです。

ですが、実際にやってみると案外面倒なところがありました。英単語を発音記号にそって読み上げてくれません。VOICEBOXにはない仕組みなので仕方ありません。

ただ、英単語が多く含まれる文章では死活問題です。せめて辞書登録機能へ登録する読みを自動生成できないかとAIに頼ってみました。

NotionAIの場合

得意とする範疇ではないためか、おそらくあまり向いていません。出力されないか、それなりに出力してもルビ用タグ(rb)が入り交じることになります。

ChatGPTの場合

NotionAIと違って、文意まで解釈してくれるので別の意味でややはまります。

ChatGPTが文意の正確な把握を試みました。そこまでは要らないのです。

正解はこちら。

そして、VOICEBOXの解説によると、指定フォーマットのテキストにすることでとりこみ読み上げしてくれるとあります。そこで更に一工夫。

以下の文章について、意味を無視して単に日本語発音表記に変換して。改行毎に文頭へ「ずんだもん,」と入れて。

うまくいきました。結果をテキストファイルに保存して、VOICEBOXで取り込みます。

あとがき

英単語読みの扱いが悩みのタネでしたが、AIである程度カバーできそうなので助かりました。多量の英単語を使うとそれはそれで管理の手間がうっすらと見えるので、そこそこでやっていこうと思います。