
クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2025年4月号
クラウド事業本部コンサルティング部の石川です。今月号で特に注目のアップデートは、Amazon SageMaker Unified Studioの一般提供開始(GA)とAmazon S3 Tables と SageMaker Lakehouse の統合が一般提供開始(GA)です!つまり、SageMaker Unified Studioも S3 Tablesも、プロダクションでも導入できるということです。他にもアップデートがあるので紹介します!
Amazon SageMaker Unified Studio
新機能・アップデート
2025/03/13 - Amazon SageMaker Unified Studio が一般提供開始
ついに、Amazon SageMaker Unified Studioの一般提供開始(GA)になりました。Amazon SageMaker Unified Studioは、AWSが提供するデータ分析とAI/ML開発のための統合開発環境です。従来のAmazon SageMakerでも機械学習の開発環境は提供されていましたが、SageMaker Unified Studioの最大の特徴は、他のAWSサービスとのシームレスな統合にあります。特に、Amazon Athena、Amazon Redshift、AWS Glue、Amazon EMR、Amazon Bedrock、Amazon SageMaker AIなど、複数のAWSサービスの機能にアクセスできるです。
下記のブログでは、Amazon SageMaker Unified Studioの概要から設定手順、一般提供開始までの変更点まで、包括的に解説しています。
Amazon SageMaker Lakehouse
新機能・アップデート
2025/03/28 - Amazon SageMaker、標準化を強化してデータガバナンスを改善するためのメタデータルールを発表
Amazon SageMaker Catalog では、メタデータルールがサポートされました。データをパブリッシュとサブスクライブする際に、メタデータルールを用いることでメタデータ標準を適用できるようになりました。メタデータルールはコンプライアンスを改善し、監査への準備を強化し、より効率的で管理されたアクセスワークフローを実現できるようになります。
Amazon S3 Tables
新機能・アップデート
2025/03/13 - Amazon S3 Tables が S3 コンソールでのテーブルの作成とクエリのサポートを追加
Amazon S3 Tablesは、Amazon S3コンソール経由して、Amazon Athenaを利用して簡単にテーブルの作成が実行できるようになりました。この機能は、S3 コンソール上でテーブルを作成できるのではなく、S3 コンソール上からAmazon Athena のクエリエディタを呼び出し、SQLを実行することでテーブルが作成されます。
なお、Amazon Athena のSQLを実行することでテーブルが作成できる機能は、Amazon S3 Tables の Amazon SageMaker Lakehouse との統合の機能となります。
このブログでは、実際にこの機能を試しています。
2025/03/13 - Amazon S3 Tables と SageMaker Lakehouse の統合が一般提供開始
ついに、Amazon S3 Tables が Amazon SageMaker Lakehouse との統合が一般提供開始(GA)になりました。Amazon S3 Tables が Amazon SageMaker Lakehouse との統合 とは、S3 Tablesのデータを様々なAWS 分析サービスから簡単にクエリや結合が可能になることです。この機能のプレビュー開始時点では、参照系クエリのみでしたが、更新系クエリやDDLのサポートなど段階的に機能が追加されました。
下記のブログでは、Amazon SageMaker Lakehouse の統合の概要から統合の流れ、一般提供開始で新たにできるようになったことまで、包括的に解説します。
2025/03/14 - Amazon Data Firehose でリアルタイムのストリーミングデータを Amazon S3 Tables に配信可能に
Amazon Data Firehose がリアルタイムのストリーミングデータを S3 Tables に配信できるようになりました。この機能は、受信レコードの内容に基づいて、データを異なる S3 Tables のテーブルに動的にルーティングできます。Firehose と S3 Tables の連携には、Glue データカタログのリソースリンクとアクセス権限の設定が必要です。
下記のブログでは、Amazon Data Firehose がリアルタイムのストリーミングデータを Amazon S3 テーブルに配信する機能を試しています。
Amazon Redshift Provisioned / Redshift Serverless
新機能・アップデート
2025/03/12 - Amazon Aurora PostgreSQL と Amazon Redshift のZero-ETL 統合が複数の統合のサポートを開始
Amazon Aurora PostgreSQL と Amazon Redshift のZero-ETL 統合が、同じ Aurora クラスターから最大 5 つの統合をサポートするようになりました。Zero-ETL 統合は、Aurora PostgreSQL をデータソース(送信元)として、Amazon Redshift をターゲット(受信先)とする一方向のデータレプリケーションです。今回のアップデートで、Aurora PostgreSQL クラスターから複数の Amazon Redshift へのデータ連携が可能になりました。 Amazon Aurora PostgreSQL で信頼できる唯一の情報源(SSOT)を維持しつつ、関連するデータサブセットを異なる Amazon Redshift に分散し、ストレージとクエリのパフォーマンスの両方を最適化できます。
2025/03/17 - Amazon Redshift Serverless がリリースアップデートの最新トラックおよびトレーリングトラックのサポートを開始
Amazon Redshift Serverless においても、最新トラックとトレーリングトラックの 2 つ異なるリリースサイクルで利用できるようになりました。最新トラック(current
)では、最新の機能、セキュリティアップデート、パフォーマンス強化を備えた最新の認定リリースバージョンを利用できます。一方、トレーリングトラック(trailing
)では、1 つ前の認定リリースを使用します。
Amazon Redshift Serverless のトレーリングトラックで Amazon Redshift Serverless ワークグループのサブセットを実行して、すべてのワークグループにリリースを導入する前に、お使いの環境で数週間の統合検証を行うことができるようになりました。
APIの変更点
2025/03/06 - Redshift Data API Service - 1 updated api methods
ClusterIdentifier、WorkgroupName、および Database でステートメントをフィルター処理するための ListStatements API のサポートが追加されました。
Amazon QuickSight
新機能・アップデート
2025/03/31 - Amazon QuickSight launches scheduling and alerts in embedded dashboards
APIの変更点
2025/03/28 - Amazon QuickSight - 25 updated api methods
- データセットの行レベルセキュリティ(RLS)設定のRLS_RULESフラグを使用することで、ユーザーごとのデータアクセス権限を制御可能になりました
- 埋め込み機能ではQ in QuickSightや閾値アラート、スケジュール設定、スナップショット生成などの高度な分析ツールを外部アプリケーションに統合できるようになりました
- データセットの更新管理面では、API経由でリフレッシュ通知メールの有効/無効を切り替えられる機能が追加されました
- テーブル表示のカスタマイズ機能では列幅・データ型・インデックス指定がAPIで制御可能となり、視覚的なレイアウト調整がプログラム可能になりました
- ダッシュボードQ&A機能のAPI制御できるようになりました
- データソース接続時にはOracle Service Nameの指定がサポートされました
AWS Glue
新機能・アップデート
2025/03/14 - AWS Glue 5.0 での AWS Glue データカタログビューのサポートを発表
Apache Spark ジョブ用の AWS Glue 5.0 で AWS Glue データカタログビューのサポートを開始しました。
AWS Glue データカタログビューは、昨年の8月にGA担った機能で、Amazon Athena と Amazon Redshift 等から AWS Glue データカタログにマルチエンジン SQL ビューを作成したり、そのアクセス権限を付与したり、それに対してクエリを実行したりできる機能です。
AWS Glue データカタログビューと AWS Glue 5.0 を併用することで、複数のエンジンからクエリを実行できるビューを Glue 5.0 Spark ジョブから作成できます。参照先のテーブルにアクセスする必要はありません。
APIの変更点
2025/03/13 - AWS Glue - 4 updated api methods
Glue Catalog Resourceに AllowFullTableExternalDataAccess が追加されました。
AWS Clean Rooms
APIの変更点
2025/03/18 - AWS Clean Rooms Service - 4 new23 updated api methods
PySparkジョブのサポートが追加されました。お客様は、承認済みのPySpark分析テンプレートを使用してジョブを実行し、データを分析できるようになりました。
Amazon DataZone
新機能・アップデート
2025/03/28 - Amazon DataZone で公開用のメタデータルールのサポートを開始
Amazon DataZone は、既存のサブスクリプションワークフローのサポートに加えて、データ公開ワークフローのメタデータルールもサポートされるようになりました。この機能強化により、プロデューサーとコンシューマーの両方のワークフローで一貫したメタデータ標準を適用できるようになります。
なお、Amazon DataZoneが管理するカタログとAmazon SageMaker Catalogのカタログは、基本的には異なる目的と体験を提供しますが、共通の基盤であるため、SageMaker Catalogのメタデータルールのサポートのアップデートと同様です。
APIの変更点
2025/03/13 - Amazon DataZone - 8 updated api methods
プロジェクトと環境の更新のサポートが追加されました。
2025/03/21 - Amazon DataZone - 3 updated api methods
Amazon DataZone ドメイン API の一部として、デフォルトの AWS IAM Identity Center インスタンスの選択を上書きするためのサポートを追加します。
AWS Lake Formation
APIの変更点
2025/03/14 - AWS Lake Formation - 9 updated api methods
LakeFormation OptIn API に「条件」が追加され、RegisterResource と DescribeResource に WithPrivilegedAccess フラグも追加されました。
最後に
今月号で特に注目のアップデートは、Amazon SageMaker Unified Studioの一般提供開始は、データ分析からAI/MLモデル開発、デプロイまでの一連のワークフローを単一のインターフェースで実現し、開発効率とコラボレーションを向上させます。
また、データレイクハウス/データメッシュの領域では、Amazon S3 TablesとSageMaker Lakehouseの統合がGAとなり、S3 Tablesの本格導入も進めたいところです。
その他に、Amazon Data FirehoseからS3 Tablesへのリアルタイムデータ配信対応や、SageMaker CatalogおよびAmazon DataZoneにおけるメタデータルールのサポートは、ガバナンスの効いたデータ分析基盤の運用を支援します。
さらに、Amazon Aurora PostgreSQLとRedshift間のZero-ETL統合における複数連携サポートの開始や、Amazon Redshift Serverlessでのリリーストラック選択肢の提供は、データ連携や運用の柔軟性を高めます。Amazon QuickSightにおける埋め込み機能の強化やAPI拡充も、エンドユーザーへのインサイト提供を加速させるでしょう。