
クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2025年5月号
クラウド事業本部コンサルティング部の石川です。今月号の注目のアップデートは、Amazon SageMaker Lakehouseが、Athena、Redshift、Glue、EMRなどに対して一元的に属性ベースのアクセス制御(ABAC)をサポートしたことです、、、めっちゃ地味ですけど。QuickSight がダッシュボードのバージョニングや生成系BI機能(Amazon Q)の組み込みをサポートしたのも気になります。コストの観点で、Redshift Serverlessが「Serverless Reservations」を発表しました。他にもアップデートがあるので紹介します!
Amazon SageMaker Unified Studio
新機能・アップデート
2025/04/02 - Amazon SageMaker が 9 種類のビジュアル ETL 変換を追加
Amazon SageMakerのVisual ETLに「派生列」「フラット化」「現在のタイムスタンプ追加」「配列やマップの行展開」「タイムスタンプ変換」「配列を列に変換」「交差」「制限」「列の連結」の9つの新しい変換機能が追加されました。
ブラウザ上でドラッグ&ドロップ操作だけで高度なデータ変換やパイプライン構築が可能となり、従来必要だったカスタムコードなしで多様なデータ処理が効率的に行えるようになりました。
2025/04/09 - Amazon SageMaker Catalog、SageMaker Unified Studio に技術的な識別子の高精度な検索機能を追加
Amazon SageMaker Catalogの新機能は、列名やテーブル名などの技術的識別子に対し、完全一致・部分一致検索を実現するものです。検索語を二重引用符で囲むことで、特定の技術名に正確または部分的に一致するデータ資産を素早く特定できます。
アナリストは特定のカラムを迅速に発見し、データ管理者は命名規則の検証、エンジニアは一時テーブルの特定などが効率化されます。大規模で複雑なデータカタログ管理を支援し、データガバナンスやチーム間の連携強化にも役立ちます。
2025/04/30 - Amazon SageMaker scheduling experience for Visual ETL and Query editors
Amazon SageMakerの新しいスケジューリング機能により、Visual ETLフローやクエリエディタで作成した処理を、同じ画面からAmazon EventBridge Schedulerを使って簡単に定期実行できるようになりました。
従来はコードベースのワークフロー作成が必要だった定期実行が、ノーコードで設定・管理・監視でき、業務効率が向上します。
Amazon SageMaker LakeHouse
新機能・アップデート
2025/04/24 - Amazon SageMaker Lakehouse now supports attribute based access control
Amazon SageMaker Lakehouseが新たに属性ベースのアクセス制御(ABAC)をサポートしました。これにより、IAMユーザーやロールに「部署」や「地域」などのタグ(属性)を付与し、その属性に基づいてデータアクセス権限を動的かつ一括で管理できます。ユーザー追加や組織変更時もタグを付け替えるだけで権限調整が可能となり、従来のような個別のポリシー設定が不要です。
柔軟性・効率性・スケーラビリティが大幅に向上し、きめ細かなデータアクセス制御が実現します。
今回のアップデートは、新たにAmazon SageMaker Lakehouseに対するAWS Lake Formationによる属性ベースのアクセス制御 (ABAC) です。下記のGrant permission 画面の先頭に Principal type というセクションが追加され、「Principals by attributes」を選択すると、この機能を設定に必要な項目が表示されます。
下記のブログでは、S3 Tablesに対するAmazon SageMaker Lakehouseの属性ベースのアクセス制御(ABAC)を実際に試しています。
Amazon Redshift / Redshift Serverless
新機能・アップデート
2025/04/22 - Announcing Serverless Reservations, a new discounted pricing option for Amazon Redshift Serverless
Amazon Redshift Serverlessの新機能「Serverless Reservations」は、1年間の利用を約束することで、従来の従量課金より最大24%の割引価格でRedshift Processing Units(RPU)を利用できる新しい料金オプションです。前払いなし(20%割引)と全額前払い(24%割引)の2つの支払い方法が選べ、コスト削減と予測性向上が可能です。予約分は複数AWSアカウントで共有でき、超過分は従量課金で柔軟に対応できます。
下記のブログでは、新しい割引価格オプションについて解説しています。
2025/04/23 - Amazon Redshift adds history mode support to 8 third-party SaaS applications
Amazon Redshiftは、SalesforceやServiceNow、SAPなど8つのサードパーティSaaSアプリケーションとのZero-ETL統合で「履歴モード」を新たにサポートしました。
ETL処理することなく各アプリのデータ変更履歴をRedshift上で自動的に追跡・保存でき、過去データの分析や傾向分析、監査レポート作成が容易になります。特定テーブルごとに履歴追跡の有効化も選択でき、柔軟なデータ管理とコスト削減を実現します。
APIの変更点
2025/04/22 - Redshift Serverless - 5 new api methods
Redshift Serverless Reservations 機能をサポートするための新規および更新された API メンバーを提供します。
Amazon QuickSight
新機能・アップデート
2025/04/01 - Amazon QuickSight が組み込み QuickSight での Amazon Q をリリース
Amazon QuickSightの新機能「Amazon Q in embedded QuickSight」は、ダッシュボードやアプリケーションに生成系BI機能を組み込み(embedded)、自然言語での質問から即座にインサイトやビジュアルを生成できるようになりました。
エグゼクティブサマリーで重要な情報を瞬時に把握でき、ダッシュボード作成や複雑な計算も自然言語で簡単に実行可能。さらに、数行のコードで開発者がアプリにQ&A機能を追加でき、データの説明や提案資料も自動生成できます。
下記のブログでは、実際に埋め込まれたダッシュボードを確認できます。
2025/04/01 - Amazon QuickSight がダッシュボードのバージョニングを開始し、任意の分析を任意のダッシュボードに公開可能に
Amazon QuickSightの新機能「ダッシュボードのバージョン管理」と「任意の分析を任意のダッシュボードへ公開」は、ダッシュボード作成者の生産性を大幅に向上させます。
バージョン管理により、過去のダッシュボードのバージョンや変更履歴を簡単に確認・復元でき、問題発生時も迅速に元の状態へ戻せます。また、どの分析からでも既存ダッシュボードを上書き公開できるため、利用者がブックマークしたリンクを変更せずに最新内容へ更新可能です。
下記のブログでは、この2つの新機能を実際に試しています。
APIの変更点
QuickSight での分析とシート レベルの強調表示のサポートを追加します。
AWS Glue
APIの変更点
2025/04/09 - AWS Glue - 3 updated api methods
AWS Glue の TableOptimizer API は、各 TableOptimizerRun で DpuHours フィールドを返すようになりました。クライアントはマネージド Apache Iceberg テーブル圧縮最適化での課金に使用される DPU 時間を把握できるようになります。
Amazon Kinesis
新機能・アップデート
2025/04/21 - Amazon Kinesis Data Streams increases default shard limits to up to 20,000 per AWS account
Amazon Kinesis Data StreamsのProvisioned キャパシティモードで、1アカウントあたりのデフォルトシャード上限が従来の500から最大20,000に大幅拡大されました(米国東部、米国西部、欧州アイルランド)。
1アカウントで最大10GB/秒の書き込み、20GB/秒の読み出し処理が可能となり、大規模なリアルタイムデータストリーミングや分析ワークロードを、より簡単かつ迅速にスケールできるようになります。
東京リージョンに来るの待ってます!
AWS Clean Rooms
新機能・アップデート
2025/04/02 - AWS Clean Rooms Spark SQL が集計およびリスト分析ルールのサポートを開始
AWS Clean Rooms Spark SQLの新機能では、Spark分析エンジンを用いた「集計ルール」と「リスト分析ルール」がサポートされ、プライバシーを強化しながらデータ分析が可能になりました。
複数企業間で生データを共有せずに、ターゲットオーディエンスの抽出や共同統計分析などが実現できます。既存コラボレーションのSpark化も容易になり、より柔軟かつ安全なデータ活用が可能になりました。
2025/04/30 - AWS Clean Rooms now supports multiple results receivers in a collaboration
AWS Clean Roomsの新機能により、Spark SQLクエリの分析結果を複数のコラボレーションメンバーが直接受け取れるようになりました。
例えば広告主と媒体社の共同分析時に、両者が同時に結果を受領・検証でき、外部の監査手段が不要となります。指定した複数メンバーのS3に自動で結果が配信され、透明性と利便性が向上します。
APIの変更点
2025/04/01 - AWS Clean Rooms Service - 1 updated api methods
コラボレーションの分析エンジンを更新するためのサポートが追加されました。
Amazon OpenSearch
新機能・アップデート
2025/04/02 - Amazon OpenSearch Ingestion パイプラインの強化されたオートスケーリング機能を発表
アップデートされた Amazon OpenSearch Ingestionのオートスケーリング機能は、これまでのCPUやメモリ使用率だけでなく、Amazon SQSキューサイズ、永続バッファラグ、受信HTTP接続数といった新たな指標に基づき、パイプラインの自動スケールを実現します。
ワークロードの変動に応じてリソースを最適化し、取り込みのボトルネックを軽減、パイプライン全体のパフォーマンス向上や高スループットなデータストリーム処理が可能となります。
最後に
今回ご紹介したアップデートを振り返ると、各アナリティクスサービスの機能がAmazon SageMaker Unified Studioに提供されたり、Amazon SageMaker LakehouseのABACサポートなど、より本番環境で利用できる機能が続々と拡充されました。今後もこの傾向は続くことが予想されます。QuickSight の生成系BIやダッシュボードのバージョン管理など、現場の多様なニーズに応える新機能も次々と登場しました。
Amazon Redshift Serverlessが「Serverless Reservations」を発表、リザーブドインスタンス(RI)のように1年間の利用を約束することで最大24%安くなり、とても要望の多かったアップデートです。
今後も引き続き、最新の動向をキャッチアップしながら、現場のニーズに応じた最適なソリューションをご紹介します。