
くらにゃんが喋った日。中の人ナシのVTuber実装して生配信してみた【AITuberくらにゃん】
⚠️ はじめに ⚠️
本ブログで作成する配信は技術検証の一環として作成されたものです。
あくまでAITuberプログラムの動作検証・学習目的であり、非公式・実験的な内容となります。
くらにゃんを利用した公式な広報・プロモーション等を目的としたコンテンツではありません。
お手元でAITuberの実装を試す際にはモデル・音声の権利関係などよく確認の上実施ください。
概要
AITuberとは「AI(人工知能)」+「VTuber(バーチャルYouTuber)」を組み合わせた言葉です。
通常のVTuberでは“魂”となる人がリアルタイムで喋っていますが、AITuberはそういった部分を人間ではなく生成AIに担わせています。
今回は私が大好きな弊社公式マスコット「くらにゃん」を Gemini 搭載の AITuber と化し、
中の人ナシの一問一答生配信をやってみました。
視聴者のコメントを拾い、ボイス付きでおしゃべりします
システム構成
配信画面を準備した裏で、ローカル端末でPythonスクリプトを走らせています。
リポジトリはこちらです。
配信用ソフトウェアはOBS Studioを利用。
配信画面を手動で整えてから、スクリプトを起動。
スクリプト内では以下の処理をループさせています。
配信者との動きの同期やリップシンクなどは実装していません。
本配信のくらにゃんはVTuberっぽく動いていますが、これはAdobe After Effectsのパペット機能で単純なループアニメーションをつけた素材(mp4)を置いているだけです。
配信アーカイブ
今回実装したAITuberくらにゃんによる配信アーカイブです。
かわいいね……おしゃべりしてくれてありがとう
主にボイスにより皆様各々のくらにゃん像と解釈違いが生じていたら申し訳ありません。
超オススメ参考書籍
実装にあたっては書籍『AITuberを作ってみたら生成AIプログラミングがよくわかった件』(著:阿部 由延 @sald_ra 氏)を大いに参考にさせていただきました。
難しそうなテーマながら配信に必要な要素・AITuber実装の流れが平易・丁寧に説明されていて
更に読者が実装を試しやすいよう配信画面も配布されています。
配信・プログラミングそれぞれの初心者の方にも非常におすすめの書籍です!
続巻の『AITuberを作ってみたらプロンプトエンジニアリングがよくわかった件』も回答精度を高めるため読んでみようと思います。
将来展望
ここから更にプロンプトエンジニアリングを突き詰め、自分のキャラクター解釈に対する一致度を高めた回答を得たいところです。
また企業公式キャラクターとしても、こんなことが実現できそうです。
- 公式イベントでAITuberが登壇
- 社内イベントでお知らせをAITuberが読み上げ
- 社外向けのサービス案内や問い合わせにAITuberが対応
おわりに
配信画面の準備や設定、音声合成APIなど、
普段の業務で触ることのない技術に多く触れることができて楽しかったです。
みなさんもぜひ理想のキャラクターを実装して配信・会話を楽しんでみてはいかがでしょうか。
配信素材クレジット
- VOICEVOX:ずんだもん
- 素材:AO material 様
- 音楽:魔王魂 様