LT登壇資料「AWS re:Invent 2025で見たGrafana最新機能」

LT登壇資料「AWS re:Invent 2025で見たGrafana最新機能」

先日のGrafana Meetup Japan #7におけるLT登壇資料です。re:Invent 2025のExpoブースにてGrafanaが推している機能がコンパクトに纏まっていたので、その内容をお届けしています。Grafana Assistantもアツいですよ!
2025.12.14

先日開催されたGrafana Meetup Japan #7において、「re:Invent 2025で見たGrafana最新機能のご紹介」というタイトルで登壇したので、その内容をご紹介。

https://grafana-meetup-japan.connpass.com/event/376412/

re:Inventのあの巨大なExpoでアピールされていた機能や、それに関連するAIアシスタントのデモなども実施したので、是非参考にしてください。

登壇資料

登壇概要

AWS re:Invent 2025のGrafana Labsブースで聞いた最新機能を紹介するLT資料です。

・Adaptive Telemetry
・LLMを活用してダッシュボード作成やインシデント対応を支援する「Grafana Assistant」
・Grafana CloudとOSS版の機能差分の解説

以下、登壇内容となります。スライド内のリンクなどもまとめているので、是非こちらもご覧ください。

私のre:Invent参加履歴とGrafanaとの関わり

slide02.png

まず簡単に自己紹介させてください。私は2017年にクラスメソッドに入社して以来、AWS re:Inventには2017年、2018年、2019年、2022年、2023年、2024年、そして今年2025年と、計7回参加しています。

コミュニティ活動としては、JAWS-UGコンテナ支部の運営や、Grafana MeetupのCo-organizerを務めています。さらになんと、Grafana Championにも認定いただきました!

気になる方は、ぜひこちらから申し込んでみてください。

https://grafana.com/community/champions/

slide05.png

実は、GrafanaがAWS re:InventのExpoにブースを出展するようになったのは2024年からです。なので、私がGrafanaブースを訪問できたのは今年で2回目だったりします。

今日お話する内容はこんな感じです。

  • re:Invent 2025で聞いたAdaptive Telemetry
  • Grafana Assistant
  • Grafana CloudとGrafana OSS版の違い

re:Invent 2025で聞いたAdaptive Telemetry

slide09.png

re:Invent 2025のGrafana Cloudブースで一番推されていたのが、このキャッチフレーズでした。こういう巨大なExpoブースで何をメッセージングするのかは各社のブースの出展戦略に直結するので、いつも自分はここのメッセージに注目しています。

「Higher-value telemetry, lower costs」

「より価値の高いテレメトリを、より低いコストで」。これを実現するのがAdaptive Telemetryというわけです。

Adaptive Telemetryとは

Adaptive Telemetryは、データの利用状況を自動分析し、使われていないデータの削減や集約を推奨・実行することで、可観測性を損なわずにノイズを削減してくれる機能です。

皆さんも経験があると思いますが、メトリクスやログなどのデータって「とりあえず全部送っておこう」とやりがちですよね。でも、そうするとコストがどんどん膨れ上がってしまいます。

Adaptive Telemetryを使えば、価値のあるデータは残しつつ、不要なデータは賢く減らすことができるんです。

Adaptive Telemetryの主要機能

この機能群は段階的にリリースされてきました。

2023年リリース

  • Adaptive Metrics(メトリクスの最適化)
  • Adaptive Logs(ログの最適化)

2025年10月8日 一般提供開始

  • Adaptive Traces(トレースの最適化)

2025年10月8日 Private Preview開始

  • Adaptive Profiles(プロファイルの最適化)

Adaptive Metricsの使い方

実際の画面を見てみると、Adaptive Metricsでは各メトリクスに対して「Received series」(受信したシリーズ数)、「Current rule impact」(現在のルールの影響)、「Recommendation impact」(推奨による削減効果)が一覧で表示されます。

不要なメトリクスの特定

slide13.png

具体的な例を見てみましょう。一番上のloki_write_request_...というメトリクスに注目してください。

このメトリクスは13,000(13.0K)シリーズものデータが発生しているのですが、実際はほとんど使われていません。右側の「Recommendation impact」を見ると、ワンクリックで13,000シリーズ分のコストを削減できることがわかります。

これにより、どのメトリクスがどれだけコストに影響しているか、そしてどれだけ削減できるかが一目でわかるんです。

RCA workbench

slide15.png

ブースでは、RCA workbench(Root Cause Analysis workbench)のデモも見せてもらいました。

これは複数のサービスやエンティティを横断して、タイムライン形式で異常やエラーを可視化できる機能です。Summary、Timeline、Graph、Mind mapといった複数のビューで問題を分析できます。

障害の主要原因をタイムラインで追う

RCA workbenchの強力な点は、システム全体で何が起きているかを時系列で可視化できることです。

画面中央のタイムラインを見ると、frontendサービスで大きな障害(Failure/Error)が起きていることがすぐにわかります。その下にあるproductcatalogserviceなど、依存関係にあるサービスの状態も判別可能です。

通常なら、各サービスのログを個別に検索して突き合わせる作業が必要ですよね。でも、RCA workbenchでは全てのサービスの異常検知(Anomaly)やエラーが1つのタイムラインに統合されているので、一目で状況を把握できます。

AIを利用した原因究明

slide17.png

さらに、AIを活用した原因究明機能もあります。

frontendの赤いエラー部分をクリックして詳細画面を開くと、具体的に何が閾値を超えているのか(Breach)がリストアップされます。右側の赤いバーが続いている時間帯が、障害が継続している期間です。

ここがポイントなのですが、Adaptive Telemetryで無駄なノイズデータは削減しつつも、障害対応に必要な重要なシグナルはしっかり残っているんです。そしてAI(SiftやAsserts)を活用することで、このように正確に原因箇所を特定できます。

詳細については、私が書いたブログ記事も参考にしてください。
https://dev.classmethod.jp/articles/reinvnet-2025-expo-grafana/

Grafana Assistant ― AIでGrafanaをもっと使いやすく

次に紹介するのはGrafana Assistantです。ここで話す詳細は、下記ブログを参考にしてください。

https://dev.classmethod.jp/articles/grafana-assistant-create-dashboard/

Grafana Assistantとは

Grafana Assistantは、Grafana Cloudに専用のLLMを組み込んだもので、オペレーター、開発者、SREがインシデントのトラブルシューティング、ダッシュボード管理、製品に関する質問への回答を数分で行えるようにする機能です。

もう少し詳しく言うと、Grafanaインターフェース内で直接インテリジェントでコンテキストを意識したヘルプを提供するエージェント型LLM統合です。一般的なワークフローを効率化し、質問に答え、オブザーバビリティデータを最大限に活用できるよう支援してくれます。

Grafana Assistantのリリース記事が概要を掴むのに非常に良いです。ぜひこちらも合わせて参照してください。

https://grafana.com/blog/2025/08/14/ai-for-grafana-onboarding-get-your-teams-started-quicker-with-grafana-assistant/

Grafana Assistantの開始方法

slide24.png

Grafana Cloudの左メニューから「Assistant」を選択すると、Terms and Conditionsの承諾画面が表示されます。プラグイン設定ページで有効化すれば、すぐに使い始められます。

嬉しいことに、2026年1月1日までは無料で使えます。ただ、2025年12月14日現在、以降どれくらいの料金になるかは、自分が探した限り、まだ情報が見当たりませんでした。

Assistantの3つのモード

Assistantには3つのモードがあります。

  1. Assistant - 幅広い質問、ダッシュボード作成、Grafana全般のタスク
  2. Deep Investigation - バックエンドでエージェントが協調して1つの問題を深く調査
  3. Dashboarding - ダッシュボードの作成・管理に特化

ダッシュボード作成の実例

実際に試してみた例をいくつか紹介します。

例1:既存データソースからダッシュボード作成

slide25.png

「tigerdataデータソースのダッシュボードを作ってください。tokyo_weather_dataというテーブルに時系列で気温、湿度などが入っているので、それぞれのパネルを作ってください。」

このように指示すると、Assistantは以下のような処理を自動で行ってくれます。

  • 利用可能なデータソースを一覧取得
  • SQLテーブルを検索
  • テーブル構造(datetime、temperature、precipitation、humidity)を確認
  • 新しいダッシュボードを作成
  • 各気象データ用のSQLクエリを実行してパネルを生成

例2:学習用ダッシュボードの作成

slide25.png

「ダッシュボードの作り方を学ぶため、ランダムデータソースを使った折れ線グラフが1つ存在するダッシュボードを作成してください」

こんなシンプルな指示でも、Grafanaのテストデータソースを使ってランダムウォークのサンプルデータを表示する学習用ダッシュボードを作ってくれます。

例3:製造業向け保全ダッシュボード

slide26.png

もっと複雑な例も試しました。プレス機の保全用ダッシュボードを以下のような詳細な指示で作成してみました。

  • サイクルタイム(秒、10〜15秒)
  • 最大プレス圧力(トン、90〜110トン)
  • 金型温度(℃、10〜100℃)
  • 周囲温度(℃、10〜40℃)
  • 周囲湿度(%、10〜70%)
  • 振動加速度(m/s²、0.01〜0.1)
  • モーター電流値(A、30〜80A)
  • 騒音レベル(dB、60〜80dB)

「それぞれ適切なデータ可視化の方法を提案して」「周囲温度、湿度は最新の値だけ可視化できれば良い」といった指示も含めたところ、時系列データは折れ線グラフで、現在値はゲージで表示するなど、適切なパネルタイプを選んでダッシュボードを構成してくれました。

slide27.png

Grafana CloudとGrafana OSSの違い

最後に、Grafana CloudとGrafana OSS版の違いについて整理しておきます。公式にも比較ページがありますので、詳細はこちらを参照してください。これ、すごいURLやな…

https://grafana.com/oss-vs-cloud/

Open Source版の位置づけ

Grafana Labsは、オープンソースへの投資が世界をより良くすると信じて、オープンな場でソフトウェアを開発しています。フラッグシップのGrafanaに加えて、Grafana Loki、Grafana Tempo、Grafana Mimir、Grafana Faro、Grafana Beylaなどをリリースし、OpenTelemetryやPrometheusといったプロジェクトにも貢献しています。

Grafana Cloudの位置づけ

Grafana Cloudは、メトリクス、ログ、トレースをGrafanaとともにパッケージ化したフルマネージドの可観測性サービスです。Prometheus、Mimir、Loki、Tempoといった最高のオープンソース可観測性ソフトウェアを、インストール、メンテナンス、スケーリングの手間なく利用できます。Kubernetesモニタリングやアプリケーション可観測性など、ターンキーソリューションにより、より速く簡単に可観測性を実現できます。

主な機能差分(Grafana Cloud限定機能)

1. コスト最適化・テレメトリ管理

機能 説明 備考
Adaptive Metrics 未使用・部分使用のメトリクスを集約してカーディナリティを削減 Cloud限定
Adaptive Logs 低価値ログパターンを特定しドロップ率を推奨 Cloud限定
Adaptive Traces tail samplingで価値の高いトレースのみを保持 Cloud限定
Adaptive Profiles ワークロードに応じてプロファイリングデータ収集を動的調整 Cloud限定(プライベートプレビュー)

2. AI/ML機能

機能 説明 備考
Grafana Assistant LLMを活用したエージェント型AIアシスタント。インシデント対応、ダッシュボード管理、製品の質問に対応 Cloud限定
Sift インフラストラクチャテレメトリの調査を自動実行するML搭載の診断アシスタント Cloud限定(無料で利用可能)
異常検出・予測 履歴データから異常パターンを特定し、今後の状態を予測 Cloud限定
Incident Auto-summary インシデントタイムラインからLLMで要約を自動生成 Cloud限定

Grafana Cloudの進化の方向性

このように、マネージドな部分、特にLLMなどを利用したAI機能は、基本的にGrafana Cloudの方に寄せられていく方向性にあると感じています。

もしかしたら将来、OSS版にローカルLLMとの連携機能がリリースされる可能性もありますが、現時点ではAI活用機能はCloud限定です。

これからのAI活用がGrafanaの中でリリースされていく中で、OSS版だけではなくGrafana Cloudの進化の方向性も注視しておくのが良いでしょう。

Amazon Managed Grafanaは?

ちなみに、AWSユーザーとしては気になるAmazon Managed Grafanaについても触れておきます。

Grafana ダッシュボード - Amazon Managed Service for Grafana - AWS

基本的には、Grafana OSS版のAWSマネージドホスト機能として理解するのが良いです。今回紹介した各種アシスタントやAI/ML機能はありません。

以下の部分はAmazon Managed Grafanaならではのメリットと言えます。やはりOSS版をセルフホストするよりは、このあたりのAWSの他の機能との連携部分に優位性がありますね。

  • Amazon CloudWatch logs/metrics、AWS X-Ray tracesなどとのネイティブ統合
  • AWS IAM Identity CenterやSAML 2.0による認証統合
  • VPCエンドポイントによるプライベート接続
  • Enterpriseプラグインアップグレードにより、ServiceNow、Splunk、Datadog、Dynatraceなどのサードパーティデータソースにも接続可能

ただ、バージョンが古かったり(2024年5月にバージョン10になったのが最後)ため、最新機能を使いたい場合は注意が必要です。

最後に

Grafanaは、進化が全く止まらないのでいつも楽しいですね。特に近年は、AI/MLをベースとして、Observabilityが次の領域に入りつつあるなと強く感じています。アツいです。

皆さんもどんどん触って、OSSコントリビュートしたり、ブログ書いたり、ミートアップで登壇したりチャレンジしてもらえればと思います。

皆さんの中から、次のGrafana Championの方が登場するのを楽しみにしています!

それでは今日はこのへんで。濱田孝治(ハマコー)でした。

関連リンク

この記事をシェアする

FacebookHatena blogX

関連記事