
SaaS に AI 機能を追加するときの料金設計を各社事例と COMPASS フレームワークで整理してみた
いわさです。
SaaS on AWS の技術支援をよくするのですが、「AI 機能を SaaS に組み込んだときの料金モデルをどうすべきか」という相談を受けることが増えました。
考え方やフレームワークがいくつかあって、お客様との会話で使うことなどはあったのですが、ブログで整理したことがなかったのでまとめてみます。
AI 機能を追加している主要な SaaS の料金ページを調べてみると、Salesforce・GitHub Copilot・HubSpot・Notion など、いずれも「シート+何か」のハイブリッド構造になっていて、AI 機能は従来のシート料金とは別のメトリクスで課金しています。
その「何か」の部分をどう設計するかについて、AWS・Zuora・Simon-Kucher 共著のホワイトペーパー「The AI pricing pivot」で紹介されている COMPASS フレームワークが整理に使えるので紹介します。
COMPASS フレームワークは AI の課金メトリクスを選ぶためのフレームワークです。
今回はこれを掘り下げてみます。
各社の料金設計
AI 機能の料金設計を考えるにあたって、シートベースのプラットフォームに AI をアドオンした代表的な SaaS を整理してみました(2026年6月時点)。
| サービス | 従来料金 | AI 課金メトリクス | AI 課金の単価例 | 経緯 |
|---|---|---|---|---|
| Salesforce Agentforce[1] | CRM シートベース | Flex Credits(アクション単位)or 会話単位 | 100,000クレジット/$500(1アクション≒$0.10)、1会話/$2 | 2024年に会話単位で開始→2025年5月に Flex Credits 追加[2] |
| GitHub Copilot[3] | リポジトリ・CI/CD は別体系 | シート+プレミアムリクエスト従量 | Business $19/ユーザー/月、高性能モデル $0.04/リクエスト | 基本シートベース。高性能モデル利用分のみ従量 |
| HubSpot Breeze[4] | Marketing / Sales / Service Hub のシートベース(Professional $90〜/シート/月) | HubSpot Credits+解決会話/推薦リード | 1,000クレジット/$10、解決会話/$0.50、推薦リード/$1.00 | 2025年11月にクレジット制必須化[5] |
| Notion[6] | メンバー単位(Business $20/月) | Business 以上は AI 内包。Custom Agent のみクレジット | 1,000 Credits/$10[7] | 当初 $10/メンバーのアドオン→2025年5月に Business 内包化。Agent のみ別課金 |
共通して見えるのは、従来のシート料金はそのまま維持しつつ、AI 機能は別メトリクスで課金(クレジット、解決件数、リクエスト数など)しているという構造です。
いずれも「固定(シート)+ 従量(AI の利用量)」のハイブリッドになっています。
クレジット制を採用する企業が増えていて、複数種類の AI 機能を1つの共通単位でまとめて管理できる利点があるようです。
業界全体で見ても、Topline の調査(SaaS 600社対象)によるとシートベースで課金している SaaS のうち 84% が何らかの従量課金を併用しているとのこと。
Of the SaaS companies that charge by seat in that dataset, 84% also carry some form of usage-based charge.
また、Kyle Poyar 氏(元 OpenView Partners、SaaS プライシングの専門家)が240社のソフトウェア・AI 企業を対象に行った調査[8]によると、過去12ヶ月で以下の変化が起きています。
Seat-based pricing is down from 21% to 15%. Hybrid pricing is up from 27% to 41%.
シートベースは 21% → 15% に低下し、ハイブリッド(サブスクリプション+従量の組み合わせ)は 27% → 41% に急増しています。
「固定+従量の組み合わせ」がすでに多数派になっています。
COMPASS フレームワーク
各社の料金を調べた結果、「固定+従量」のハイブリッドは共通パターンだとわかりました。
従量課金で「何を計量するか」の選択を体系化したのが COMPASS フレームワークです。
そもそもなぜシートベースの定額に AI を載せるだけでは不十分なのかというと、AI は使われるほどモデル推論コストが積み上がるため、顧客に価値を届けるほど収益性が悪化するという構造になるからです。
加えて、AI が人間の仕事を代替するとシート数自体が減る可能性もあり、提供価値が増しているのに売上が下がりうる。
この問題を解消するためにシートとは別のメトリクスが必要だ、というのが COMPASS フレームワークの出発点です。
COMPASS フレームワークの概要
COMPASS フレームワークは Zuora の Michael Mansard 氏が開発したフレームワークです。
正式名称は「Choice of Optimal Metrics for Pricing Agentic Systems and Solutions」、日本語にすると「エージェント AI の最適な課金指標を選ぶための手法」といったところでしょうか。
Mansard 氏は Zuora で Principal Director of Subscription Strategy を務め、350社以上のサブスクリプションモデル変革を支援してきた人物です。
INSEAD(フランスのビジネススクール)でサブスクリプション戦略の講師も兼任しており、この分野の専門家として知られています。
COMPASS フレームワークは AWS・Zuora・Simon-Kucher(ドイツ発祥のプライシング戦略コンサルティングファーム、東京にもオフィスあり)の3社共著ホワイトペーパーで中核として紹介されています。
Zuora 公式ブログでは CEO の Tien Tzuo 氏が使い方を解説しています。
4つの課金モデルと選び方
COMPASS フレームワークでは AI の課金モデルを4つに分類し、「2つの質問に答える」ことで自社に合うモデルを選びます。
| モデル | 考え方 | 例 |
|---|---|---|
| エージェント単位 | AI の利用権に定額課金 | AI 営業担当に月額課金 |
| アクティビティ単位 | AI の動作1回ごとに課金 | チャット対応1会話あたり課金 |
| アウトプット単位 | 完成した成果物に対して課金 | 契約書ドラフト1件あたり課金 |
| アウトカム単位 | ビジネス成果に対して課金 | コスト削減額の一定割合を課金 |
下に行くほど「顧客が感じる価値」に近いメトリクスになりますが、測定・帰属の難易度が上がります。
では自社の AI にはどれが合うのか。
Zuora 公式の解説によると、以下の2つの質問で判断します。
質問1「AI の仕事の範囲は?」
| レベル | 考え方 | 例 |
|---|---|---|
| タスク自動化 | 単純で反復的な1つの作業 | 請求書スキャン→データ抽出→ERP 登録 |
| プロセス管理 | 複数システムを跨ぐ一連の業務フロー | 保険クレーム処理(書類収集→確認→振り分け→支払い) |
| 目標達成 | 大きな目標に向けて自ら方法を選んで動く | 広告予算を複数チャネルで自律配分して広告費用対効果を最大化 |
質問2「成果を"AI のおかげ"と明確に言えるか?」
| レベル | 考え方 | 例 |
|---|---|---|
| 弱い | 効果はあるが他要因と分離しにくい | 議事録作成 AI。生産性は上がるが売上貢献額は測れない |
| 中程度 | 成果物は明確だが、最終成果には他要因も影響 | サポート回答下書き AI。応答速度は測れるが他の研修効果と区別しにくい |
| 強い | 成果が直接計測でき、AI のおかげと明確に言える | EC の動的価格調整。マージン改善額がそのまま金額で見える |
2つの質問の組み合わせで推奨される課金モデルが決まります。
COMPASS フレームワークではこのマッピングを「3x3 Matrix」として定義しています[9]。

具体的な例で考えてみます。
例1: カスタマーサポート SaaS に AI チャットボットを追加するケース
サポート SaaS に、問い合わせを AI が自動対応する機能を追加する場合を考えます。
AI は問い合わせ内容を分類し、回答を生成し、解決できなければ人間にエスカレーションします。
この AI の仕事の範囲はプロセス管理(分類→回答生成→解決確認→引き継ぎ判断の一連のフロー)にあたります。
帰属の明確さは中程度〜強いです。「AI が解決した件数」は計測できますが、人間のフォローアップが入るケースとの境界があります。
→ マトリクス上の推奨モデルはアウトプット単位(解決件数で課金)です。
例2: ナレッジ管理 SaaS に議事録要約 AI を追加するケース
社内 Wiki 的な SaaS に、会議を録音して要約を自動生成する AI 機能を追加する場合を考えます。
AI は音声を文字起こしし、要点をまとめ、アクションアイテムを抽出します。
この AI の仕事の範囲はタスク自動化(録音→文字起こし→要約という定型的な処理)にあたります。
帰属の明確さは弱いです。「議事録が良くなったから売上が上がった」とは言えず、生産性向上は実感できても金額換算しにくい。
→ マトリクス上の推奨モデルはエージェント単位(定額課金)です。
このように、同じ「SaaS に AI を追加する」でもマトリクス上の位置が変わるとメトリクスの選び方が変わります。
14の質問で検証する
ただし、マトリクスはあくまで方向性を示すものです。
COMPASS フレームワークにはもう1つ、候補メトリクスの妥当性を検証するための「14の質問チェックリスト」が用意されています。
マトリクスで方向性が決まったら、具体的なメトリクスの候補を14の質問で検証します。
COMPASS フレームワークには7つの評価軸があり、各軸に「売り手視点」と「買い手視点」の問いが1つずつ、合計14問のチェックリストが用意されています[10]。
| # | 軸 | 売り手視点の問い | 買い手視点の問い |
|---|---|---|---|
| 1 | 価値との連動 | このメトリクスは顧客の KPI と連動しているか? | 顧客がサービスを活用するほど、SaaS 提供側の売上も伸びる構造か? |
| 2 | 帰属の明確さ | 成果を自社プロダクトの貢献と主張できるか? | 顧客も「このプロダクトのおかげ」と認めるか? |
| 3 | わかりやすさ | 顧客が請求書の金額変動を理解できるか? | 顧客が事前に費用を見積もれるか? |
| 4 | 公平感 | 多く払う顧客は多くの価値を受け取っていると感じるか? | 利用量が大きくなっても不公平に感じないか? |
| 5 | 拡張性 | 顧客規模が拡大しても仕組みが破綻しないか? | 成長を罰するような構造になっていないか? |
| 6 | 予測可能性 | 売り手は収益を正確に予測できるか? | 買い手は予算を立てられるか? |
| 7 | 収益性 | 変動コストをカバーし健全な利益を維持できるか? | コスト構造が変化しても持続可能か? |
先ほどの2つの例で、各軸が高い/低いをざっくり判断してみます。
厳密なスコアリングではなく、チームでの議論のイメージです。
例1(サポート AI、メトリクス候補: 解決件数で課金):
| 軸 | 評価 | 理由 |
|---|---|---|
| 価値との連動 | 高い | 顧客の KPI「サポートコスト削減」「解決率」に直結 |
| 帰属の明確さ | 中〜高 | AI が解決した件数は計測可能。ただし人間が後からフォローしたケースとの境界はある |
| わかりやすさ | 高い | 「解決1件あたり○円」は直感的にわかる |
| 公平感 | 高い | 解決しなければ課金されないので納得感がある |
| 拡張性 | 高い | 問い合わせが増えても仕組みは破綻しない |
| 予測可能性 | 中程度 | 過去の問い合わせ件数からある程度見積もれるが、月ごとの変動はある |
| 収益性 | 中程度 | 1件あたりの推論コストは低いが、長い会話は高コストになりうる |
全体的にバランスが良く、「解決件数」はこのケースのメトリクスとして妥当そうです。
唯一気になるのは予測可能性で、問い合わせ件数は月ごとに変動するため買い手側の予算が立てにくい可能性があります。
対策としては月額の上限設定や料金シミュレーターの提供が考えられます。
例2(議事録 AI、メトリクス候補: 月額定額):
| 軸 | 評価 | 理由 |
|---|---|---|
| 価値との連動 | 低い | 定額なので顧客の利用量・成功度と売上が連動しない |
| 帰属の明確さ | 低い | 議事録の品質向上が売上にどう寄与したかは証明しにくい |
| わかりやすさ | 高い | 「月額○円」は最もシンプル |
| 公平感 | 中程度 | たくさん使う顧客も少ない顧客も同額。ヘビーユーザーにとっては得、ライトユーザーには割高感 |
| 拡張性 | 高い | 定額なのでスケールしても仕組みは変わらない |
| 予測可能性 | 高い | 売り手も買い手も完全に予測可能 |
| 収益性 | 中程度 | ヘビーユーザーの推論コストを吸収する必要がある |
予測可能性・わかりやすさが高い一方、価値との連動が弱い。
ここで気になるのは収益性です。
議事録要約 AI は会議のたびに文字起こし+要約の推論コストが発生します。
定額課金だと、毎日何時間も会議をするヘビーユーザーの推論コストを売り手が全て吸収することになり、テーブルでも「中程度」と評価しましたが、顧客数が増えるほどリスクが大きくなります。
マトリクスでは「エージェント単位(定額)」と出ましたが、14問で検証すると収益性のリスクが見えてきました。
定額のまま提供するとヘビーユーザーのコストで赤字になるリスクがあるので、もう一段の設計検討が必要です。
この対処については後述します。
このように、マトリクスだけで決めるのではなく14問で検証することで「定額のままだとまずいケース」に気づけるのが COMPASS フレームワークの二段構えの良さです。
このように、14の質問は「正解を出す」ためではなく「トレードオフを可視化する」ためのツールです。
全軸満点のメトリクスは存在しないので、どこが弱くてどこが強いかを意識的に選ぶことがポイントです。
なお、完全なアウトカム単位(成果報酬型)は現時点ではまだ少数派です。
AWS・Zuora・Simon-Kucher のホワイトペーパー「The AI pricing pivot」では以下のように述べられています。
True outcome-based metrics are still rare, used by less than ~10% of generative AI and AI agent offers studied.
Kyle Poyar 氏の調査でも、アウトカムベースを主要モデルとしている企業は現時点で 5% とのこと[11]。
多くの企業はアクティビティ〜アウトプットに位置しています。
14問で弱点が見つかったときの対処
COMPASS フレームワークの14問で「収益性が弱い」「予測可能性が弱い」などの弱点が見つかった場合、ハイブリッドモデルの設計パターンで補うことができます。
プライシング専門家の Mark Stiving 氏(UC Berkeley PhD、25年以上のプライシング実務経験)がこのパターンを整理しています。
先ほどの議事録 AI のケース(定額課金で収益性にリスクがある)であれば、以下のような選択肢が考えられます。
- 定額+月間利用上限を設ける(例: 月30時間まで。超過分は従量課金)
- ティア制にする(ライト/スタンダード/プロで利用上限を変える)
- クレジット制にして利用量を可視化する(月間クレジットを配布し、超過分を購入)
Notion の Custom Agent が「AI は Business プランに含むが、Agent だけはクレジット制」にしているのも同じ考え方だと思います。
COMPASS フレームワークはメトリクスの方向性を決めるところまでを担い、そこから先の具体的な料金構造の設計はハイブリッドの設計パターンで補う、という役割分担です。
料金変更と顧客への影響
COMPASS フレームワークのホワイトペーパーでは、プライシングは一度決めたら終わりではなく定期的に見直すべきだと述べられています。
とはいえ、一度公開した料金を変更するのは顧客への影響が大きいのも事実です。
各社が実際にどうやって料金モデルを変更・追加しているかを見てみます。
Salesforce は2024年に「1会話 $2」で Agentforce を開始し、2025年5月に Flex Credits を追加導入しています[12]。
既存の会話ベースを残したまま、新しい選択肢を追加する形です。
Notion は $10/メンバー/月のアドオンだった AI 機能を、Business プラン以上に内包する形に変更しました[13]。
上位プランの付加価値を高める方向です。
HubSpot は2025年11月にクレジット制を必須化しましたが、それ以前に対象機能を有効化していた顧客には2026年4月まで無料期間を設けています[14]。
共通しているのは、既存顧客に一方的に強制しないことです。
猶予期間を設けたり旧モデルを残したりして、新しいモデルを選択肢として追加する形をとっています。
上位プランへの内包や無料枠の提供でネガティブな印象を緩和する工夫も見られます。
各社とも最初から完璧なモデルを出すのではなく、シンプルに始めて調整しているのがわかります。
さいごに
本日は AI 機能を持つ SaaS のプライシングについて、公開情報をもとに COMPASS フレームワークを中心に整理してみました。
実際の技術支援の中ではこのフレームワークに当てはまらないパターンや、フレームワークは一旦置いてこうやったほうが良かったなという経験もあるのですが、そのあたりは個別の支援の中でお伝えするようにしています。
各社の料金を見ると「固定(シート)+ 従量(AI の利用量)」のハイブリッド構造がすでに標準になっています。
従量部分のメトリクスをどう選ぶかについて、COMPASS フレームワークの「仕事の範囲 × 帰属の明確さ」のマトリクスは議論の整理に使えそうです。
完全なアウトカムベースは10%未満という現状を考えると、アクティビティ〜アウトプット、もしくはクレジット制が現実的な落とし所になりそうです。
Salesforce も HubSpot も途中でモデルを変更・拡張しているので、最初から正解を出す必要はなく、まずはシンプルに出して反復するのが良さそうだなと調べてみて思いました。









