
【登壇資料】「生成AIと物体検知 (YOLO)の活用例について」というタイトルでDevelopersIO 2025 Osakaに登壇しました #devio2025
はじめに
こんにちは、クラウド事業本部 運用イノベーション部の大野です!
2025年9月3日に開催された"DevelopersIO 2025 Osaka"にて、「生成AIと物体検知 (YOLO)の活用例について」というタイトルで登壇いたしました!
今回の発表では、生成AIとYOLOの組み合わせの利点とソリューションの例についてご紹介しました。
以下に資料とダイジェスト(+感想)を公開します!
登壇資料
ダイジェスト
物体検出(Object Detection)はオワコンではない
生成AIが台頭し久しい昨今ですが、物体検出もその波に乗れず埋もれてしまったとお考えの方も多いかも知れません。
実際に自分がそうであり、その想いから今回の登壇内容を決定いたしました。
しかし実際にはオワコン(終わったコンテンツ)化しておらず、むしろ生成AIと併用することで相乗効果を生み出すことができる技術であると分かりました。
実際に生成AIとYOLOを併用した以下のような研究も発表されています。
- YOLOにより監視カメラ内の物体(人・車など)を検出し、生成AIにて文脈付きテキスト要約(事故の状況など)を生成する
https://arxiv.org/html/2501.04764v1?utm_source=chatgpt.com - 生成AIで合成した洪水画像をYOLOモデルの学習に使用し、災害時の避難経路や被害範囲を予測する
https://x.gd/1SFTC
YOLOと生成AIの長所・短所
未強化のYOLOモデル(yolo11x.pt)と、最新・最上位モデル(Gemini 2.5 Pro)の生成AIとで検出精度を比較した際は、後者の方に軍配が上がりました。
また検出結果の再現性においてもかなり高く、同じ入力画像・プロンプトで何度か出力を生成(都度リセット)しましたが、毎回ほとんど同じ回答が生成されたため信頼性の高さも感じました。
利用者側でモデルのトレーニングをすることなく、高品質の検出結果を得られるのはとてもありがたいですね。
しかし、
- 完全オフライン環境で使用できない
- 利用コストがかかる
- APIのレート制限や、提供元の不具合により利用できないタイミングがある
などの弱点もあるため、全方向で優秀であるとは断言できません。
反対にYOLOの場合は上記弱点を全てカバーできるため、用途や環境によっての使い分けが重要であることが分かります。
感想
6月に入社して以降、今回が初めての登壇でした!
趣味性が高く普段の実務と関係の無い内容となりましたが、多くの方からありがたいフィードバックも頂戴でき大変良い経験になったと思います。
お忙しい中、私のセッションにご参加頂いた方々におかれまして、改めて感謝申し上げます。
また機会があれば、今回のテーマを深掘りした内容で登壇したいと思っておりますので、その際もぜひよろしくお願いいたします!!