[セッションレポート] Stack Overflow と Gemini DEV200 #GoogleCloudNext

Google Cloud Next '24 When AI meets data: Stack Overflow and Gemini (DEV200) のセッションレポートです。
2024.04.14

2024年2月に Stack Overflow と Google Cloud の AI分野における戦略的提携が発表されました。今回の Next'24 で Stack Overflow を含む複数のパートナーからのデータとナレッジソースで、コーディング支援のための Gemini Code Assist を改善すると発表がありました。

両社の提携に関して、Google Cloud の責任あるAIへの取り組みや製品統合、またAI時代のナレッジコミュニティの必要性について 2024/4/10 Google Cloud Next'24 のセッション When AI meets data: Stack Overflow and Gemini で聞くことができましたので共有します。

登壇者:Cheng Wei(Product Manager, Google), Ryan Polk(Chief Product Officer, Stack Overflow)

責任あるAI (Responsible AI)

AIの進化に伴い、AI技術の開発と利用における倫理的な課題が注目されています。Stack Overflow と Google はこの課題に積極的に取り組む姿勢を強調しました。特にデータの提供元への帰属を重視し、生成AIをコミュニティへ還元することを積極的に行うことで、AI技術を社会に役立てるための新しいスタンダードを築くことを目指しています。

AI時代のナレッジコミュニティの重要性とAIの活用

Stack Overflow の Ryan Polk氏 はAI時代でもナレッジコミュニティは重要であると説きます。
「今ではほとんどの開発者がAIチャットボットやコード支援ツールを駆使して開発を進めている。しかし、物事を深く掘り下げて物事を学んでいるわけではないということを発見した。「人間」はコンテキストを提供する最良の情報源でありリソースで、コミュニティに入り人間同士が関わることは開発者の学習プロセスにおいて重要である」。

また、生成AIにとってもナレッジコミュニティのデータはトレーニングのために最も強力なフィードバックであり、生成AIのメカニズムの一部であるとしています。さらに今度は、生成AIがナレッジコミュニティを強化するために利用され、ナレッジコミュニティと生成AIは相互にうまく作用し循環すべきである、と説明しました。

Stack Overflow の Gemini 活用

Stack Overflow には Staging Ground というサービスがあります。これは、質問者が質問を一般公開する前に経験豊富な有識者からレビューを受ける機能です。これにより、質問と回答の品質が高まるというメリットがあります。しかし、非常に価値のある機能であるにも関わらず人員不足によりスケールせず、多くの質問が自動的に処理されるという問題があったようです。

Stack Overflow は Gemini を活用することにより、例えば Staging Ground で質問を作成する人と回答する人の両方をAIでサポートできるようになるといったことを想定しています。具体的には質問の文章作成をサポートしたり、回答者が質問者の文脈や意図を理解するのをサポートしたりできるのはとのことです。 これにより、人員不足の問題は解決し価値のあるサービスがスケーリングできると期待しています。

Gemini for Google Cloud への Stack Overflow の統合

Gemini for Google Cloud の 一つの要素である Gemini Cloud Assist は、Cloud Console 上のAIチャットインタフェースを介して 設計からデプロイメント、トラブルシューティング、運用、最適化までを Google Cloud のアーキテクチャを踏まえて支援するツールです。
Gemini Cloud Assist は 事前学習済モデルの Gemini による予測に加え、ユーザ環境のリソースメタデータやテレメトリデータ、さらに最新の Stack Overflow のナレッジをデータソースとして活用し、Cloud Console 上でインサイトのやビジュアライゼーションを提供します。

Stack Overflow には5,800万件以上の質問と回答があり、約14秒に1回の割合で質問が寄せられ、回答が提供されています。また、69,000 以上の技術タグが存在し、510億回以上利用されている膨大なナレッジであり、生成AIによる高精度な回答に寄与します。

なお、生成AIの回答のソースとなった Stack Overflow のリンクは明確に示され、ユーザがソースをたどることができます。これは、 Stack Overflow が「生成AIに求めるデータソースの明示」であり、それに対して Google は責任あるAIの姿勢を表しているものだと言えます。

まとめ

Gemini Cloud Assistant が学習データとして Stack Overflow を利用することにより、Google Cloud を活用するユーザの課題解決をさらに効率化するでしょう。また、Stack Overflow も高精度な生成AIにより恩恵を受けられると期待しています。

ナレッジコミュニティやデータソースとなるプロバイダは生成AIに対して危機感を持っているものも少なくないと思いますが、このような相互にシナジーを発揮できるような前向きな生成AIエコシステムの形成について今後も注目していきたいと思っています。

さいごに

本日より開催される Google Cloud Next '24 には弊社から6人が現地参加しております。
引き続き、アップデートやセッションレポートなどは随時共有してきたいと思います。

また、Next '24 の翌週に帰国したばかりの現地参加メンバーが振り返り勉強会を行いますので是非とも現地でご参加ください!