Flutter から Gemini Nano を動かす - ML Kit GenAI API の6機能を試してみた

Android のオンデバイス生成 AI モデル Gemini Nano を、ML Kit GenAI API 経由で Flutter から呼び出し、6機能（プロンプト・要約・校正・書き換え・画像の説明・音声認識）を検証しました。現時点でできることの全体像をまとめます。

takuro abe

2026.07.05

 はじめにAndroid のオンデバイス生成 AI モデル Gemini Nano を ML Kit GenAI API 経由で Flutter アプリから呼び出し、

提供されている6機能（プロンプト・要約・校正・書き換え・画像の説明・音声認識）を一通り実装して動作を確認しました。
本記事では「Flutter + Gemini Nano で現時点（2026年7月）に何ができるのか」の全体像をまとめます。

各機能の詳細は個別記事として公開予定です。
 Gemini Nano / ML Kit GenAI API とは!ML Kit GenAI API は2026年7月時点で全てベータ版以前のステータスです。

本記事は執筆時点の情報に基づきます。
Gemini Nano は、ネットワーク接続不要・端末内完結で動作する Google のオンデバイス基盤モデルです。

Android のシステムサービス AICore 上で実行され、モデルの配布・更新や安全性フィルタは AICore が一元管理しています。
Gemini Nano には nano-v2 / nano-v3 というバージョンがあり、性能差があります。

どのバージョンで動作するかは端末に依存します（Android Developers Blog）。
ML Kit GenAI API は、タスクごとに以下の6つの高レベル API を提供しています。

入力に画像や音声を扱えるものもありますが、出力は全てテキストです。


タスク
API


カスタムプロンプト（テキスト/マルチモーダル）
Prompt API

要約
Summarization API

校正
Proofreading API

書き換え
Rewriting API

画像の説明
Image Description API

音声認識
Speech Recognition API

 リリースステータスと動作条件2026年7月時点で GA（正式リリース）の API は存在せず、全てベータ版（音声認識のみアルファ版）です。

GA の時期もアナウンスされておらず、ベータ版の API は SLA や非推奨化ポリシーの対象外です。
対応デバイスは Pixel 9/10 シリーズ、Galaxy S25/S26 など一部フラグシップ機のみで、AICore を持たないエミュレーターでは動作しません。
 利用規約上の注意点ML Kit GenAI API 追加利用規約では以下の点が明記されています。
Preview/Experimental Access 指定の API は "production use" が禁止されている
生成物の著作権を Google は主張しないが、公開前の妥当性判断は利用者側の責任
モデルのリバースエンジニアリング・抽出は禁止されている
業務での採用を検討する場合は、この点に留意が必要です。
 Flutter からの呼び出し方ML Kit GenAI API は Android ネイティブ（Kotlin/Java）向けにのみ提供されており、公式の Flutter プラグインは存在しません。
今回は、型安全なプラットフォーム間通信コードを生成するツール Pigeon を使って Dart ↔ Kotlin のブリッジを自前実装し、Flutter から6機能全てを呼び出せるようにしました。
 6機能でできること実際に Pixel 10 で動かして確認した、6機能それぞれの入出力イメージを紹介します。
 プロンプト（テキスト/マルチモーダル）自由記述のプロンプトに対してテキストで応答します。
テキストのみ、または画像+テキストの組み合わせ（マルチモーダル）で送信できます。他の5つの専用 API がカバーしないタスクに使える、最も汎用的な機能です。
 要約記事やチャット会話などの長文を箇条書きで要約します。

入力タイプによっては最低文字数などの制約があります。
 校正短めの文章に対して、文法チェックと誤字脱字の修正を行います。
 書き換え文章のトーンや長さを変換します。「丁寧に」「簡潔に」「絵文字を増やす」など、複数のスタイルから選択できます。
 画像の説明画像から短い説明文を生成します。

※ Image Description API に言語オプションはなく、現バージョンでは英語で出力されます
 音声認識マイク入力をリアルタイムに文字起こしします。日本語にも対応しています。
 アプリでの活用イメージ6機能に共通する価値は「オフライン動作」「プライバシー（データを外に出さない）」「低レイテンシ」の3点です。
次のような使い方が考えられます。
プロンプト: チャットアプリの返信サジェスト、問い合わせ内容の分類
要約: ニュース記事の3行要約、商談メモや日報の要約
校正: SNS 投稿や顧客向けメッセージの送信前チェック
書き換え: メッセージのトーン変換、報告書の文体統一
画像の説明: アクセシビリティ向けの代替テキスト自動生成、現場写真への説明付与
音声認識: ボイスメモや議事録のオフライン文字起こし
特にプライバシーの観点は業務アプリと相性が良く、機密情報や個人情報を端末の外に出さずに処理できます。
ただし、推論はアプリがフォアグラウンドの場合のみ許可されるため、バックグラウンドでの自動処理には使えません。

また、精度重視・複雑な推論が必要な場面では、クラウド LLM の方が向いています。
「ネットが弱い / 機密性が高い / 軽量な下処理でよい」場面に絞って使うのが現実的です。
 iOS 対応を見据えた参考調査（Apple Foundation Models）Flutter での両 OS 対応を見据えて、iOS 側の相当機能も調査しました（実装は行わず、調査のみです）。
iOS で Gemini Nano + ML Kit GenAI API に相当するのは、Apple の Foundation Models framework です。

iOS 26 以降、かつ Apple Intelligence が有効な対応デバイスでのみ利用できます。


観点
Gemini Nano（ML Kit GenAI API）
Apple Foundation Models


API 思想
タスク別の高レベル API（すぐ使える完成品）
汎用 API（プロンプトを自分で組み立てる）

リリースステータス
全 API がベータ〜アルファ
GA（2025年9月に正式リリース済み）

Google 側はタスクごとの専用 API を作り込み済みでプロンプト設計の負担が少ない一方、Apple 側は汎用の基盤のみを提供し、要約などのユースケースは開発者がプロンプトで自作する前提になっています。

その代わり Apple 側には、構造化出力を強制する Guided Generation や Tool Calling など、汎用 API を使いこなすための機能が揃っています。
 まとめML Kit GenAI API が提供する6機能を Flutter から一通り実装し、Pixel 10 実機で動作を確認しました。
オンデバイス AI は、通信環境や API コストを気にせず生成 AI 機能を組み込める、機密情報や個人情報を端末の外に出さずに扱える、という点でクラウド前提では難しかった体験を実現できるポテンシャルがあります。

GA と対応デバイスの拡大が進めば、要約・校正・文字起こしといった機能は「特別な AI 機能」ではなく、アプリの標準装備になっていくはずです。
iOS 側も Foundation Models framework が GA 済みで、Flutter からオンデバイス AI を両 OS で活用する土台は整いつつあります。

オンデバイス AI がアプリの当たり前になる日が楽しみです。

Flutter から Gemini Nano を動かす - ML Kit GenAI API の6機能を試してみた

はじめに

Gemini Nano / ML Kit GenAI API とは

リリースステータスと動作条件

利用規約上の注意点

Flutter からの呼び出し方

6機能でできること

プロンプト（テキスト/マルチモーダル）

要約

校正

書き換え

画像の説明

音声認識

アプリでの活用イメージ

iOS 対応を見据えた参考調査（Apple Foundation Models）

まとめ

AI白書2026 配布中

関連記事

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

EVENTS

タスク	API
カスタムプロンプト（テキスト/マルチモーダル）	Prompt API
要約	Summarization API
校正	Proofreading API
書き換え	Rewriting API
画像の説明	Image Description API
音声認識	Speech Recognition API

観点	Gemini Nano（ML Kit GenAI API）	Apple Foundation Models
API 思想	タスク別の高レベル API（すぐ使える完成品）	汎用 API（プロンプトを自分で組み立てる）
リリースステータス	全 API がベータ〜アルファ	GA（2025年9月に正式リリース済み）