[祝] Amazon S3 Tables が Amazon SageMaker Lakehouse との統合が一般提供開始(GA)になりました!

[祝] Amazon S3 Tables が Amazon SageMaker Lakehouse との統合が一般提供開始(GA)になりました!

Clock Icon2025.03.16

クラウド事業本部コンサルティング部の石川です。Amazon S3 Tables が Amazon SageMaker Lakehouse との統合が一般提供開始(GA)されました。Amazon SageMaker Lakehouse の統合の概要から統合の流れ、一般提供開始で新たにできるようになったことまで、包括的に解説します。

https://aws.amazon.com/jp/about-aws/whats-new/2025/03/amazon-sagemaker-lakehouse-integration-s3-tables-generally-available/

https://aws.amazon.com/jp/blogs/aws/amazon-s3-tables-integration-with-amazon-sagemaker-lakehouse-is-now-generally-available/

Amazon S3 Tables が Amazon SageMaker Lakehouse との統合 とは

S3 Tablesのデータを様々なAWS 分析サービスから簡単にクエリや結合が可能になることです。この機能のプレビュー開始時点では、参照系クエリのみでしたが、更新系クエリやDDLのサポートなど段階的に機能が追加されました。

この機能は、マネージメントコンソール有効化できます。

amazon-sagemaker-lakehouse-integration-s3-tables-ga-1

Amazon SageMaker Lakehouse の統合の特長

Amazon S3 Tablesは、Apache Icebergをサポートするクラウドオブジェクトストアで、列と行で構成されたデータの保存を簡素化します。Amazon SageMaker Lakehouseは、統一されたオープンでセキュアなデータレイクハウスで、データ分析とAIを簡素化します。この統合により、S3 TablesのデータをSageMaker Lakehouseで統一的にアクセスし、Amazon RedshiftやAmazon Athenaをはじめ様々なデータソースと結合することが可能になります。

Apache Icebergサポート

S3 TablesはApache Icebergをサポートし、データの管理と最適化を簡素化します。

統一されたデータアクセス

SageMaker Lakehouseを通じて、S3 Tables、S3バケット、Redshiftウェアハウスのデータを一元的にアクセスできます。

セキュリティとアクセス管理

データに対する細粒度のアクセス権限を設定し、すべての分析ツールやエンジンに一貫して適用できます。

多様なデータソースとの結合

S3 TablesのデータをAmazon DynamoDBやPostgreSQLなどのデータソースと結合し、より深い洞察を得ることができます。

AWS 分析サービスとの統合の流れ

SageMaker Lakehouseは、S3 Tables、S3バケット、RedshiftウェアハウスのデータをApache Icebergオープンスタンダードを使用して統一的に管理します。Amazon SageMaker Unified Studioからアクセスでき、Amazon AthenaやAmazon Redshiftなどのエンジンを通じてクエリが可能です。さらに、AWS Lake Formationを使用してデータに対するアクセス権限を管理できます。

S3 Tablesの設定

  • Amazon S3コンソールでテーブルバケットを作成し、AWS分析サービスとの統合を有効にします。
  • Amazon Athenaを使用してテーブルを作成し、データをクエリします。

amazon-sagemaker-lakehouse-integration-s3-tables-ga-2

SageMaker Lakehouseへのアクセス

  • SageMaker Unified Studioでプロジェクトを作成し、プロジェクトのARNを取得します。
  • AWS Lake FormationでIAMユーザーやロールに権限を付与します。

データの結合

  • SageMaker Lakehouseはもちろん、Amazon Redshift Spectrum や Amazon Athena のクエリエディタからも同様にアクセスできます。
  • S3 TablesのデータをAmazon DynamoDBやPostgreSQLなどのデータソースと結合し、SQLを使用してクエリします。

AWS 分析サービスとの統合を様々なユースケースで検証

Amazon S3 Tablesが、一般提供開始(GA) になったときのブログにて、AWS 分析サービスとの統合を様々なユースケースで検証を紹介しています。

https://dev.classmethod.jp/articles/amazon-s3-tables-tokyo-region-ga/

一般提供開始(GA)から可能になった点

Amazon Athenaのクエリエディタから一般提供開始(GA)以降に新たにできるようになった点について解説します。

S3 Tablesのデータベースの作成や削除

S3 Tablesのデータベースの作成や削除が可能になりました。

amazon-sagemaker-lakehouse-integration-s3-tables-ga-4

S3 Tablesのテーブルの作成や削除

S3 Tablesのテーブルの作成や削除が可能になりました。

amazon-sagemaker-lakehouse-integration-s3-tables-ga-5

S3 Tablesのテーブルに対してテーブルDDLを生成が可能に

S3 Tablesのテーブルに対してテーブルDDLを生成できるようになりました。

amazon-sagemaker-lakehouse-integration-s3-tables-ga-3

最後に

Amazon S3 Tables が Amazon SageMaker Lakehouse との統合が一般提供開始(GA)されました。この統合により、S3 Tablesのデータを様々なAWS分析サービスから簡単にクエリや結合が可能になり、データ分析やAIワークフローが強化されます。SageMaker Lakehouseを通じて、S3 Tables、S3バケット、Redshiftウェアハウスのデータを一元的にアクセスでき、Apache Icebergをサポートすることでデータ管理が簡素化されます。また、データに対する細粒度のアクセス権限を設定し、セキュリティとアクセス管理が強化されています。

Amazon S3 Tables と Amazon SageMaker Lakehouseの統合が一般提供開始(GA)に伴い、Amazon AthenaのDDLも使えるようになり、S3 Tablesをアナリティクス分野で本格運用できるようになりました。今後が楽しみです。

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.