[アップデート] Amazon SageMaker Unified Studio が IAM ベースドメインでビジネスメタデータとデータガバナンス機能をサポートしました

[アップデート] Amazon SageMaker Unified Studio が IAM ベースドメインでビジネスメタデータとデータガバナンス機能をサポートしました

Amazon SageMaker Unified Studio の IAM ベースドメインで、これまで IDC ベースドメインのみで提供されていたビジネスコンテキスト・メタデータ・データガバナンス機能が利用できるようになりました。実装内容と活用方法を紹介します。
2026.05.25

クラウド事業本部の石川です。Amazon SageMaker Unified Studio の IAM ベースドメイン(IAM-based domains)で、ビジネス コンテキスト、メタデータ、およびデータ ガバナンス機能が利用できるようになりました。これまで Identity Center(IDC)ベースのドメインが中心だったガバナンス機能が、IAM ベースドメインでも提供されるようになったことで、開発者の生産性を重視するチームでも、組織全体のデータ検出性とアクセス管理を強化できます。

https://aws.amazon.com/jp/about-aws/whats-new/2026/05/sagemaker-catalog-iam-domains/

IAM ベースドメインのアップデート

Amazon SageMaker Unified Studio(SMUS)の IAM ベースドメイン に対して、これまで IDC ベースドメインのみで提供されていた ビジネスコンテキスト・メタデータ・データガバナンス機能 を提供するアップデートです。IAM ドメインのユーザーが Glue Data Catalog テーブルに対してビジネス名・説明・README ドキュメントを付与できるようになり、AI 生成メタデータでビジネス名・説明を自動生成、ビジネス用語集・メタデータフォームテンプレートを使った構造化された属性付与も可能になりました。

20260524-smus-iam-based-domain-architecture.drawio

背景として、IAM ドメインと IDC ドメインの「機能差」を埋める流れの一環という位置付けで読むのが分かりやすいです。IAM ベースドメインは新しいサーバーレス Notebook・Athena Spark 統合などの開発者生産性ツール寄り、IDC ベースドメインは Publisher/Subscriber 形式のカタログ管理を含むガバナンス寄り、という棲み分けがあり、今回のリリースで IAM 側にカタログ/ガバナンス機能が追加された形です。

アップデート内容

今回のアップデートにより、IAM ベースドメインを使用しているお客様も、AWS Glue Data Catalog のテーブルにビジネスコンテキストを付加し、組織全体でのデータ発見・ガバナンスを実現できるようになりました。

主な変更点は以下のとおりです。

  • AWS Glue Data Catalog のテーブルに ビジネス名・説明・README ドキュメント を追加可能
  • AI 生成メタデータ により、大量のテーブルに対するビジネス名や説明を自動生成
  • ビジネス用語辞書(business glossary) を作成し、「ARR」「churn rate」など組織内の用語定義を統一
  • メタデータフォームテンプレート によりデータ分類・保持ポリシー・オーナーシップ情報などの構造化属性を定義
  • 用語やメタデータフォームフィールドを使ったテーブル横断検索
  • サブスクリプション によるアクセスリクエスト機能
  • 承認後、AWS Lake Formation 権限が自動付与される
  • 管理者はリクエストを介さず、SageMaker Unified Studio から直接テーブルへのアクセスを許可することも可能

主な機能の詳細

ビジネスコンテキストの付加

Glue Data Catalog のテーブルに対し、技術名だけでは伝わりにくい意味付けを行うためのビジネス名・説明・README ドキュメントを登録できます。データプロデューサーは、自身が公開するテーブルに業務的な文脈を補足することで、消費側の理解を助け、誤った利用を防げます。

AI 生成メタデータ

数百〜数千のテーブルを保有する組織にとって、すべてに対して人手でビジネス名や説明を整備するのは現実的ではありません。AI 生成メタデータ機能を使えば、テーブル名やスキーマから自動的にビジネス名・説明案を生成でき、カタログ作業の負荷を大幅に軽減できます。

ビジネス用語辞書(Business Glossary)

「ARR」「churn rate」「アクティブユーザー」など、組織内で揺らぎがちな用語の定義を一元化できます。テーブルやカラムに用語を紐づけておくことで、用語ベースで関連データを検索可能となり、データの一貫した理解を組織横断で促進します。

メタデータフォームテンプレート

データ分類(PII の有無、機密度)、保持ポリシー、オーナーシップ情報などの構造化属性を、テンプレート化してテーブルに付与できます。これによりガバナンスポリシーの可視化とコンプライアンス対応の両面を強化できます。

サブスクリプションとアクセス制御

データ消費者がテーブルへのアクセスを要求する際は、SageMaker Unified Studio 上で サブスクリプション をリクエストします。管理者が承認すると、AWS Lake Formation の権限が自動的に付与され、対象プロジェクトからテーブルへアクセス可能となります。リクエストを介さず、管理者が SageMaker Unified Studio から直接権限を付与することもできます。

ユースケース

このアップデートは、次のようなチームに有効です。

  • データエンジニアリングチーム: 大量のテーブルに対し AI 生成メタデータでカタログ整備を加速したい場合
  • データ分析チーム: 組織横断でビジネス用語を統一し、ダッシュボードやレポートでの解釈ブレを防ぎたい場合
  • データサイエンスチーム: 学習データセットを発見し、サブスクリプション経由で迅速にアクセスを得たい場合
  • ガバナンス担当: 開発者の俊敏性を維持しつつ、データ分類・所有権・保持ポリシーといったメタデータを組織全体に行き渡らせたい場合

これまで IAM ベースドメインを採用していた組織では、ガバナンス機能を理由に IDC ベースドメインへの移行を検討するケースもありましたが、今回のアップデートにより、IAM ベースドメインのまま組織レベルのデータガバナンスを実現できる選択肢が広がりました。

やってみた

IAM ベースドメインとプロジェクトの作成

初期状態のAmazon SageMaker Unified Studio のトップ画面では、[Get started] ボタンが表示されます。

20260524-smus-iam-based-domain-1

セットアップ画面は、特に変更せずに [Set up] ボタンを押します。すると、作成中のアニメーションのダイアログが1〜2分表示されます。

20260524-smus-iam-based-domain-2

IAM ベースドメインとプロジェクトの作成できると、Amazon SageMaker Unified Studio のトップ画面では、[Open] ボタンに表示が変わります。

20260524-smus-iam-based-domain-4

admin-project-xxxxx というプロジェクトが表示されます。右下の[Domain management]リンクをクリックします。

20260524-smus-iam-based-domain-6

ドメイン管理画面が表示され、先程のadmin-project-xxxxx というプロジェクトが一覧に表示されています。

20260524-smus-iam-based-domain-7

AI 生成メタデータを試す

ドメイン管理画面でBrowse リンクを押すとGlue Data Catalog に登録されているテーブルが一覧表示されます。初期状態で、IAM ベースドメインとプロジェクトの作成するとLake Formationに登録済みのsagemaker_sample_db.churmテーブルが作成されます。

このsagemaker_sample_db.churmテーブルにAI 生成メタデータを作成したいと思います。テーブルを表示させた状態で、[Generate suggesions]ボタンを押します。

20260524-smus-iam-based-domain-8

[Generate suggesions]ボタンを押すと、何を生成対象とするかのダイアログが表示されます。[Generate]ボタンを押します。

20260524-smus-iam-based-domain-9

1分程度でNameとDescription が自動生成されました。Glossary Termsは今回は生成できませんでした。

20260524-smus-iam-based-domain-11

最後に

Amazon SageMaker Unified Studio(SMUS) の IAM ベースドメインで、ビジネスコンテキスト・AI 生成メタデータ・ビジネス用語辞書・メタデータフォームテンプレート・サブスクリプションといった一連のデータガバナンス機能が利用できるようになりました。

開発者向けの俊敏性を重視しつつ、組織全体でのデータ検出性とアクセス管理プロセスを強化したいチームにとって、有力な選択肢となるアップデートです。IAM ベースドメインを既に利用している方も、これから SageMaker Unified Studio の導入を検討する方も、ビジネスメタデータの整備を起点としたデータ活用の高度化を検討してみてはいかがでしょうか。

この記事をシェアする

AWSのお困り事はクラスメソッドへ

関連記事