
NotebookLMの音声概要が日本語に対応したので、インターネットで公開されている英語版の「Googleのソフトウェアエンジニアリング」を読み込ませて、日本語音声を生成させてみた
NotebookLMのAudio Overviews(音声概要)が日本語に対応しました
おのやんです。
みなさん、NotebookLM使ってますか?(挨拶
日本時間の2025/04/30に、NotebookLMのAudio Overviews(音声概要)が日本語に対応したとの発表がありました。
DevelopperIOでも、記事執筆時点で同様の記事が公開されています。
もともと、NotebookLMではYouTubeやWebサイトをソースとして設定できます。これをもとに、チャットベースの文章で要約したり、テキストベースの操作が可能です。ここには音声概要の機能もあり、ソースの内容を音声で出力させることが可能でした。
この音声概要の出力として日本語が追加され、ソースの内容を日本語で発話させることが可能になりました。筆者がこのNotebookLMの日本語対応を知った時に最初にやりたいと思ったのが、英語の無料公開ドキュメントの日本語訳済み音声出力でしたので、今回やってみました。
やってみる
NotebookLMの画面を開きます。最初に、画面右上の設定画面から、言語をクリックします。
今回のアップデートにより、ここで日本語が選べるようになっています。他の言語になっている場合は、日本語に設定しましょう。
NotebookLMの作成画面にて、データソースを入力します。データソースとしてYouTube動画などが選べますが、今回はWebサイトを試してみます。
今回は、Web上で無料公開されている英語版のGoogleのソフトウェアエンジニアリングを読み込ませてみましたが、実際にはこのリンクではソースの追加に失敗します。
このリンク先のページは具体的なテキストは書かれておらず、目次用のページになっていますので、エラーが出たものと思われます。WebサイトのURLを入力する画面でも、「現時点では、ウェブサイトに表示されているテキストのみがインポートされます」と書かれています。
ということで、ここでは第2章のPrefaceのページを読み込ませたいと思います。
ソースの部分も、正常に読み込まれているようです。この画面の右側に音声概要のセクションがあるので、ここの「生成」ボタンを押します。音声ファイル作成まで数分かかりますので、そのまま待機しておきます。
生成が完了すると、NotebookLMの画面からそのまま再生できます。またwavファイルとして音声ファイルのダウンロードも可能です。
日本語がとんでもなく流暢
データソースは英語なのですが、出力された音声を聞いてみるとちゃんと日本語に翻訳され、司会進行・発表者の形式で日本人2人がソースの内容を説明してくれます。従来の音声出力でありがちだったカタコトの日本語ではなく、流暢な日本語として話してくれます。こういう対話形式の音声、最近のビジネス系YouTubeなどでよく聞きますが、それと遜色ない音声を出力してくれます。
こんにちは。今回はですね、ソフトウェアエンジニアリングアットグーグルっていう本の序文ですね、ここからグーグルがソフトウェア開発をどう見てるのか、ちょっと深く見ていきたいなと思ってます。
なんか普通にコード書くプログラミングとグーグルみたいな、こう巨大なシステムを維持していくソフトウェア。エンジニアリングってやっぱり結構違うのかなって思うんですけど、この序文、どう読みました?何かポイントありましたね。あの、まさにそこの違いが強調されてるなと。特に印象的だったのがソフトウェアエンジニアリングを時間をかけて統合されたプログラミングって定義してるんですよ。
時間をかけて統合されたプログラミング、つまりコードが書かれて使われて、ま、いつかは古くなる。そのライフサイクル全体を通して、ずっと変化に対応し続けることなんていうか、その持続可能性がすごく大事なんだっていう。
口語の日本語に特徴的な「あの」や「えっと」などのフィラーを交えながら、ネイティブの日本語に非常に近い口調で話されているので、ちょっと聞いたくらいだとAI製とは分からないのでは?と思います。「ふむふむ」や「えー」などの相槌表現にはまだ違和感を感じますが、全体的にかなりクオリティの高い日本語音声を出力してくれます。
参考までに、GitHubに音声ファイルを保存しています。音声ファイルを聞くにはwavファイルのダウンロードが必要になりますが、こちらからNotebookLMが生成する音声を確認できます。
新規情報のキャッチアップ方法が大きく変わるかもしれない
筆者がNotebookLMの日本語対応を知った時に最初にやりたかったことが、英語による無料公開ドキュメントの音声出力でした。Web上での日本語訳や生成AIにより、英語の文章を読むハードルがだいぶ下がったのですが、骨のある英文を読み進めるのはいささか億劫でした。それが、今回音声による自然な日本語での出力に対応しました。実際、英語のソースであっても、出力される日本語音声が本当に違和感がないので、学習時の言語の壁はかなり低くなっていると感じます。
今回、デフォルトで司会進行・発表者という2人の人物が対話をしながら内容を紹介する形式なので、人によってはちょっと冗長に感じるかもしれません。それでも、英語文章を読む際の強力な補助になると思うので、本文を読む前の予習として音声を聴講、その後に具体的に細部を文章で読み進める、などの使い方がいいのではと思います。
YouTubeの音声出力にも対応しているので、今後、新規の情報のキャッチアップのやり方も、NotebookLMを使った音声概要が中心になるかもしれません。引き続き動向を追っていきたいです。