【セッションレポート】データと AI を統合する Amazon SageMaker Unified Studio の世界(AWS-13) #AWSSummit

【セッションレポート】データと AI を統合する Amazon SageMaker Unified Studio の世界(AWS-13) #AWSSummit

Clock Icon2025.06.29

こんにちは!コンサルティング部のくろすけです!

2025/06/25,26 に開催された AWS Summit Japan 2025 のセッション「データと AI を統合する Amazon SageMaker Unified Studio の世界(AWS-13)」に参加してきました。

機械学習を齧っていたことがあり、最近は Amazon SageMaker への興味が再燃してきているので参加してきました!

セッションの概要

タイトル
データと AI を統合する Amazon SageMaker Unified Studio の世界

概要
AI に注目が集まる昨今、データの重要性はかつてないほどに高まっています。しかし多くの組織では、複数の環境を使い分けながらデータと AI を連携させる必要があり、開発や運用の効率化、そしてチーム間のコラボレーションが課題となっています。このような課題に応えるべく、データと AI をつなぐサービスとして登場した新しいサービスが Amazon SageMaker Unified Studio です。本セッションでは、SageMaker Unified Studio を用いて、統一的なインターフェースから AWS の幅広い分析・ AI サービスを利用して、データベースやデータウェアハウス、データレイクのデータを処理、分析し、AI アプリケーションに活用する方法を、デモを交えてご紹介します。

セッションレベル
Level 300: 中級者向け

テーマ
Data

スピーカー
関山 宜孝
アマゾン ウェブ サービス ジャパン合同会社
Principal Big Data Architect, AWS Analytics services

セッション内容

本セッションのねらい

Amazon SageMaker Unified Studio を用いてデータとAIにまつわる課題を解決する

想定聴講者

  • データとAIの活用に課題を感じている
  • Amazon S3 などの AWS の基本的なサービスを把握している

ゴール

  • Amazon SageMaker Unified Studio を知る
  • データを処理・分析しAIアプリに活用する方法を学ぶ

データとAIにまつわる課題

次世代の Amazon SageMaker(以降、SageMaker)が登場することになった背景として、データとAIにまつわる課題を紹介されていました。

複雑なツールセット

  • 進化するユースケース: AI/MLと分析のユースケースと利用者層の拡大
  • 高コストなAI/ML: 実利用で直面するコストやスピード、効率性の壁

分断したデータ

  • データのサイロ: 異なるツール間で相互運用できないデータ
  • 分断されたガバナンス: データ管理の信頼性とコンプライアンスの課題

私見ですが、メインターゲットは一定程度データの収集・活用ができているような大・中規模の組織であるように理解しました。
もちろん小規模組織でも、組織の規模拡大を見据えて Amazon SageMaker の基盤上で開発を進めていくのはありではないかと思います。

デモの詳細

架空企業のマーケティングキャンペーンをテーマにして、SageMaker をどのように活用できるかのデモをご説明いただきました。
特に「架空企業: エニーカンパニービバレッジ の課題」については、AWSが支援する中で頻繁に見られた典型的な課題だそうです。

  • 架空企業: エニーカンパニービバレッジ の概要

    • 老舗の食品・飲料メーカー
    • 2025年、売り上げが減少傾向
    • マーケティング予算の削減に直面
    • 低価格で商品を提供する競合企業の登場
  • 架空企業: エニーカンパニービバレッジ の課題

    • ツールやワークフローの分断
      • チームごとに異なるツール
    • データの分断
      • データ保存サービスの不統一
      • データへのアクセス方法の不統一
    • 手作業のデータ共有
      • チーム間でのデータ共有方法が確立されていない
      • データ共有のための煩雑な作業
      • 時間を要する承認フロー
    • モダンなAI機能への制限
      • AI機能の活用方針・方法が確立されていない
  • 目的

    • 市場プレゼンスの活性化と収益向上
  • 目標

    • マーケティングキャンペーン開発と実施

CleanShot 2025-06-29 at 00.25.01.png

  • チームメンバーとその課題
    • サラ: マーケティング担当
      • 売上減少の原因把握
      • 既存顧客の維持
      • 顧客獲得コストの削減
      • 新規顧客の獲得
    • サマンサ: データエンジニア
      • 各ステークホルダーのデータへのアクセスを迅速化
      • 複数チームで効率的に共有・活用できるデータ基盤の構築
      • 拡張性のあるデータ基盤の構築
    • ハビエル: データサイエンティスト
      • データ準備にかかる時間の短縮
      • モデル開発へのリソース集中
      • 既存チームの知見活用
      • 最先端の生成AI機能の活用

データ・分析・AI 活用のシナリオ

CleanShot 2025-06-29 at 00.22.52.png

このセッションのデモのシナリオです。
ステップおよび各担当者が記載されています。

またデモの中ではこのステップを大きく下記の3つに分類していました。
以降この記事でも、下記の3つセクションに分けて記載していきます。

  • データの発見と分析
    CleanShot 2025-06-29 at 00.35.46.png
  • モデル予測
    CleanShot 2025-06-29 at 00.36.09.png
  • AIコンテンツ生成
    CleanShot 2025-06-29 at 00.36.37.png

データの発見と分析

課題:売上トレンドの分析
機械学習ドリブンなマーケティングキャンペーンに役立つ高品質なデータを準備して共有したい

ゴール
AI/ML チームへのデータ提供

デモ
下記の7つのサブステップで解説をされていました。

CleanShot 2025-06-29 at 01.35.43.png

このステップで中心的な役割を果たすのが、SageMaker Catalog です。

CleanShot 2025-06-29 at 01.40.05.png

以降デモになりますので何をしたか、できるかについて掻い摘んで記載します。

1.データディスカバリ
このステップの概要は下記です。

  1. Amazon Q を用いたデータテーブルの検索
  2. SageMaker Catalog に事前に登録されたデータの品質などの確認

CleanShot 2025-06-29 at 01.43.50.png
CleanShot 2025-06-29 at 01.43.14.png

2.データ処理・分析
このステップの概要は下記です。

  1. Amazon Athena を利用したクエリ
  2. Amazon Q を利用したクエリの生成
  3. S3 のテーブルと Redshift のテーブルのジョイン

CleanShot 2025-06-29 at 01.49.54.png
CleanShot 2025-06-29 at 01.55.58.png

3.データパブリッシュ
このステップの概要は下記です。

  1. データを SageMaker Catalog に登録
  2. AIによるビジネスメタデータの自動生成
  3. データのパブリッシュ(チーム外へのデータの公開)

CleanShot 2025-06-29 at 01.57.32.png
CleanShot 2025-06-29 at 02.02.41.png

モデル予測

課題:トレンド予測モデルの構築
マーケティングチームがポテンシャルの高い製品を見つけて投資できるように高品質なモデルを構築したい

ゴール
投資対象製品の特定

デモ
下記の5つのサブステップで解説をされていました。

CleanShot 2025-06-29 at 02.07.46.png

こちらも以降デモになりますので何をしたか、できるかについて掻い摘んで記載します。

4.データサブスクライブ
このステップの概要は下記です。

  1. データセットのサブスクライブ(依頼および承認)
  2. サブスクライブしたデータへのクエリ

CleanShot 2025-06-29 at 02.09.52.png
CleanShot 2025-06-29 at 02.14.17.png

5.モデル構築
このステップの概要は下記です。

  1. ノートブック上で XGBoost を使ったモデルのトレーニング
  2. 構築したモデルを使った製品の未来の売上予測

CleanShot 2025-06-29 at 02.14.53.png
CleanShot 2025-06-29 at 02.17.43.png

AIコンテンツ生成

課題:マーケティングキャンペーンの生成
機械学習で見つけた知見を、マーケティングキャンペーンのコンテンツに変換したい

ゴール
コンテンツ(HTML)の生成

デモ
下記の3つのサブステップで解説をされていました。

CleanShot 2025-06-29 at 02.20.02.png

このステップで中心的な役割を果たすのが、Amazon Nova です。
テキスト形式および画像形式のコンテンツの生成に使用します。

CleanShot 2025-06-29 at 02.22.52.png

こちらも以降デモになりますので何をしたか、できるかについて掻い摘んで記載します。

6.マーケティングキャンペーン作成
このステップの概要は下記です。

  1. 生成AIプレイグラウンドでのテキスト(マーケティングメッセージ)の生成
  2. 生成AIプレイグラウンドでの画像の生成

CleanShot 2025-06-29 at 02.25.26.png
CleanShot 2025-06-29 at 02.28.54.png

セッションのまとめ

下記が データ・分析・AI活用シナリオで達成したことでした。

CleanShot 2025-06-29 at 02.33.08.png

また、架空企業: エニーカンパニービバレッジ の課題に対して下記のように解決することができたということでした。

CleanShot 2025-06-29 at 02.35.31.png

まとめ

AWS Summit Japan 2025 の「データと AI を統合する Amazon SageMaker Unified Studio の世界」セッションでは、データとAI活用における現代の課題と、それを解決する次世代のソリューションについて学ぶことができました。

Amazon SageMaker Unified Studio の主要な価値

  • 統一されたインターフェース: 複雑で分断されたツールセットを一つのプラットフォームで統合
  • データの相互運用性: データサイロを解消し、チーム間でのスムーズなデータ共有を実現
  • AI機能の民主化: 最先端の生成AI機能を含む、モダンなAI機能への簡単なアクセス
  • コラボレーションの促進: データエンジニア、データサイエンティスト、マーケティング担当者など、異なる役割のチーム間での効率的な連携

解決できる主要な課題

  • ツールやワークフローの分断による開発・運用の非効率性
  • データの分断とアクセス方法の不統一
  • 手作業によるデータ共有の煩雑さと時間コスト
  • モダンなAI機能活用への制限
  • データガバナンス統制

デモで紹介された機能

  1. SageMaker Catalog: データの発見、品質管理、メタデータ自動生成
  2. Amazon Q: 自然言語によるデータ検索とクエリ生成
  3. 統合されたデータ処理: S3、Redshift、Athena などの横断的なデータ活用
  4. Amazon Nova: テキストと画像の生成AI機能

対象組織
一定程度のデータ収集・活用ができている大・中規模組織がメインターゲットと感じましたが、将来の拡張性を見据えた小規模組織での導入も有効と考えられます。

Amazon SageMaker Unified Studio は、データとAIの統合による新しい価値創造を目指す組織にとって、非常に魅力的なソリューションであることが理解できました。
今後も、Amazon SageMaker Unified Studio について記事にしていこうと思います。

以上、くろすけでした!

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.