
クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2025年8月号
クラウド事業本部コンサルティング部の石川です。2025年夏は、AWS Summit 2025 New Yorkにて、データ分析サービスに数多くの新機能や改善が加わりました。SageMakerやQuickSightをはじめ、Redshift、Glue、S3 Vectorsなどにおいて、生産性向上やAI活用を加速するアップデートが続々と登場しています。他にもアップデートがあるので紹介します!
Amazon SageMaker Catalog
新機能・アップデート
2025/07/01 - Amazon SageMaker Catalog adds AI recommendations for descriptions of custom assets
Amazon SageMaker Catalogに、Amazon DataZoneのAIがカスタムアセットの説明文を自動で提案する機能が追加されました。Amazon S3のIcebergテーブルなどの構造化データに対し、大規模言語モデル(LLM)を利用して、テーブル概要やユースケース、列レベルの説明を生成します。これにより、手作業での文書化作業が削減され、メタデータの一貫性が向上し、組織内でのデータ資産の発見がより迅速になります。
Amazon SageMaker Lakehouse
新機能・アップデート
2025/07/16 - Amazon SageMaker streamlines S3 Tables workflow experience
Amazon SageMakerがS3 Tablesワークフローを効率化し、Amazon SageMaker Lakehouseとの統合が一般提供されました。SageMaker Unified Studio 内のクエリエディタや Jupyter Notebook を使用して、テーブルの作成、データの読み込み、クエリの実行を行うことができるようになりました。S3 Tables、S3バケット、RedshiftウェアハウスのデータにSageMaker Lakehouseを通じて一元的にアクセスできます。
Amazon DataZone
APIの変更点
2025/07/01 - Amazon DataZone - 1 updated methods
UpdateProject API に新しいオプションの domain-unit-id パラメータのサポートを追加しました。
2025/07/15 - Amazon DataZone - 4 updated methods
環境プロファイルIDの必須フィールドとしての制限の削除、S3機能をリリースしました。
2025/07/24 - Amazon DataZone - 2 updated methods
- Search および SearchListings API で返された結果内の関連テキストを強調表示をリリースしました。
- SearchListings API の指定された属性の値の集計数を返すことのサポートが追加されました。
Amazon Redshift / Amazon Redshift Serverless
新機能・アップデート
2025/07/16 - Amazon Redshift announces support for cascading refresh of nested materialized views
Amazon Redshiftが、ネストされたマテリアライズドビュー(MV)のカスケード更新に対応しました。これにより、ローカルテーブルだけでなく、KinesisやMSKなどの外部ストリーミングソース上のMVも効率的に更新できます。
新しいREFRESHコマンドではcascadeオプションは、指定したMVだけでなく、そのMVに依存する下層のMVも1つのトランザクションで連鎖的に更新されます。
例えば、vというMVをcascade付きで更新すると、その基となるuが先に更新され、次にvが更新されます。一方、restrictオプションは更新を単一のMVに限定します。この機能により、依存関係を持つ複数のMVのデータ鮮度を容易に保つことができます。
CREATE TABLE t(a INT);
CREATE MATERIALIZED VIEW u AS SELECT * FROM t;
CREATE MATERIALIZED VIEW v AS SELECT * FROM u;
CREATE MATERIALIZED VIEW w AS SELECT * FROM v;
-- w -> v -> u -> t
INSERT INTO t VALUES (1);
Amazon Redshift Serverless
新機能・アップデート
2025/07/23 - Amazon Redshift Serverless Now Supports 2-AZ Subnet Configurations
Amazon Redshift Serverlessが、Enhanced VPC Routing (EVR) を使用しない場合、2つのアベイラビリティーゾーン(AZ)でのサブネット構成をサポートしました。従来、ワークグループ作成には3つのAZが必須でしたが、この要件が緩和されます。
2025/07/23 - Amazon RDS for Oracle zero-ETL integration with Amazon Redshift
Amazon RDS for OracleとAmazon RedshiftのZeroETL統合を使用することで、複雑なETLパイプラインを構築することなく、ペタバイト規模のトランザクションデータをほぼリアルタイムで分析や機械学習に活用できます。RDS for Oracleに書き込まれたデータは数秒でRedshiftに複製されるため、複数のアプリケーションのデータから迅速かつ包括的な洞察を得ることが可能になります。
OracleとAmazon Redshiftのzero-ETL統合、ついに来た!という感じですね。
AWS Glue
新機能・アップデート
2025/07/16 - AWS Glue now supports zero-ETL integrations from Amazon DynamoDB and eight applications to S3 Tables
AWS GlueがAmazon DynamoDBなど8つのアプリケーションからAmazon S3 TablesへのゼロETL統合のサポートを開始しました。これにより、SalesforceやSAPなどのアプリケーションからS3 Tablesへのデータ抽出とロードが自動化されまました。
2025/07/17 - AWS Glue now supports new workers for larger and memory intensive workloads
AWS Glueに、データ統合と処理性能を向上させる新しいワーカータイプが追加されました。大規模でリソースを多く消費するワークロード向けに、コンピューティング、メモリ、ストレージを強化した汎用の「G.12X」「G.16X」が登場。さらに、Gワーカーの2倍のメモリを搭載し、キャッシュや集計などメモリ集約型のSpark処理に最適なメモリ最適化ワーカー「R.1X」「R.2X」「R.4X」「R.8X」も利用可能です。
2025/07/24 - AWS Glue now supports Microsoft Dynamics 365 as a data source
AWS Glueが、Microsoft Dynamics 365用の新しいネイティブコネクタの提供を開始しました。これにより、データエンジニアはDynamics 365のERPやCRMプラットフォームのデータを、AWS Glue上で効率的なETLジョブのデータソースとして簡単に統合できます。
APIの変更点
2025/07/23 - AWS Glue - 7 updated methods
AWS Glue は、ジョブ実行における動的なセッションポリシーのサポートを開始しました。複数の IAM ロールを作成することなく、ジョブ実行ごとにきめ細かなカスタム権限を指定できます。
2025/07/31 - AWS Glue - 5 updated methods
ルートノード、S3 Iceberg sources/targets、catalog Iceberg sources、DynamoDB ELT コネクタ、AutoDataQuality 評価、編集による強化された PII 検出、Kinesis fan-out サポート、および新しい R シリーズ ワーカー タイプのサポートが追加されました。
Amazon QuickSight
新機能・アップデート
2025/07/01 - Amazon QuickSight launches Trusted Identity Propagation (TIP) for Athena Direct Query
Amazon QuickSightが、Amazon AthenaのダイレクトクエリにおいてTrusted Identity Propagation (TIP)をサポート開始しました。この機能は、AWS Lake Formationのルールを使って、QuickSight上のデータへのアクセス権限をユーザーごとに行や列単位で細かく制御できます。その結果、同じダッシュボードを複数の顧客や部門で使用する場合でも、それぞれに許可されたデータのみを安全に表示させることが可能になります。
2025/07/2 - Amazon QuickSight supports 2B row SPICE dataset
Amazon QuickSight Enterprise Editionにおいて、SPICEデータセットの容量が従来の10億行から2倍の20億行に拡張されました。
2025/07/09 - Amazon Q in QuickSight is now available in 7 additional regions
Amazon Q in QuickSightの提供が、東京、ソウル、シンガポールなどアジア太平洋地域の新リージョンで一般利用可能になりました。
この生成系BI機能により、ユーザーは自然言語を使ってデータからインサイトを抽出し、質問への回答やエグゼクティブサマリーの自動生成が可能です。これにより、ビジネスアナリストの作業が加速され、迅速な意思決定を支援します。
また、Proユーザー向けの「Scenarios」機能も提供が拡大されました。今回のリージョン拡大は、サービスの遅延削減やデータレジデンシー要件への対応に貢献し、顧客データはモデルのトレーニングに使用されないため高いセキュリティを確保します。
2025/07/09 - Amazon QuickSight introduces granular access customization for exports and reports
Amazon QuickSightに、データエクスポートとレポートに関する新しいアクセス制御機能が導入されました。これにより管理者は、PDFレポート、CSV、Excelファイルといったエクスポートの種類ごとに、ユーザーのアクセス権を細かく設定できます。
この機能は、ダッシュボードからの直接的なエクスポートと、スケジュールされたメールレポートの両方に適用されます。また、メールレポートにファイルを添付せず、コンテンツへのリンクのみを送信するよう制限することも可能になりました。
2025/07/18 - Unifying data insights with Amazon QuickSight and Amazon SageMaker
AWS Summit 2025 New Yorkにて、Amazon SageMakerとAmazon QuickSightの統合が発表されました。この連携により、SageMakerでのデータ探索からQuickSightでのダッシュボード作成までが、ワンクリックでシームレスに実現します。作成されたダッシュボードはSageMakerプロジェクト内でアセットとしてカタログ化され、組織全体での発見と共有が容易になります。
SageMakerドメインを作成し、QuickSightブループリントを有効にします。
- プロジェクトプロファイルにQuickSightブループリントを追加します。
- SageMaker Unified Studioにログインし、QuickSightブループリントが有効なプロジェクトを作成します。
- プロジェクトのデータタブにあるレイクハウスカタログからテーブルを選択し、「Open in QuickSight」アクションを実行します。
- これにより、ユーザーはQuickSightにシングルサインオンされ、データセットが作成されます。
- QuickSightでは、データソースに関連付けられた「制限付きフォルダ」が作成され、データセット、分析、ダッシュボードなどのすべての資産がそのフォルダ内に保存されます。
- QuickSightで作成されたダッシュボードは、自動的にSageMaker Unified Studioのプロジェクトカタログ内で発見可能となり、共有や公開が可能です。
APIの変更点
2025/07/15 - Amazon QuickSight - 3 updated methods
トピックのカスタム指示を導入しました。
2025/07/31 - Amazon QuickSight - 6 updated methods
Impala コネクタのサポートが追加されました。
Amazon OpenSearch Service
新機能・アップデート
2025/07/28 - Amazon CloudWatch and Amazon OpenSearch Service launch pre-built dashboard for AWS Network Firewall
Amazon CloudWatchとOpenSearch Serviceを連携させたAWS Network Firewall用の新しい事前構築済みダッシュボードを発表しました。トラフィックパターンやプロトコルなどのネットワークメトリクスに関する洞察を提供し、セキュリティチームのトラブルシューティング能力を強化します。管理者は、異常なネットワーク活動を迅速に特定し、プライベートネットワーク接続を監視することで、セキュリティ設定を最適化できます。このダッシュボードはCloudWatch Logs InsightsやOpenSearch Serviceコンソールで作成可能です。
APIの変更点
2025/07/15 - Amazon OpenSearch Service - 7 updated methods
AWS OpenSearch に、S3 Vector エンジンオプションの有効化のサポートが追加されました。このオプションを有効にすると、S3 Vector エンジンを使用してインデックスを作成できるようになりました。
2025/07/31 - Amazon OpenSearch Service - 7 updated methods
AOS データ ソースの IAMFederation を使用した NEO-SAML のきめ細かなアクセス制御のサポート。
Amazon OpenSearch Serverless
APIの変更点
2025/07/29 - OpenSearch Service Serverless - 4 updated methods
AOSSのIAMFedratonを使用したSAMLのきめ細かなアクセス制御のサポートです。
Amazon EMR
APIの変更点
2025/07/31 - Amazon EMR - 3 updated methods
Amazon EMR RunJobFlow、ModifyCluster、および DescribeCluster API に新しいパラメータ「ExtendedSupport」が追加されました。
Amazon MSK
新機能・アップデート
2025/07/16 - Announcing Model Context Protocol (MCP) Server for Amazon MSK
Amazon MSKが、モデルコンテキストプロトコル(MCP)サーバーを発表しました。標準化された自然言語インターフェースやAIエージェントを用いてMSKクラスターの操作が可能になります。このMCPサーバーは、AIエージェントにクラスターのメトリクス、構成、運用状況などを集約して提供します。エージェントは、クォータや容量制限、ベストプラクティスなどの制約を理解し、情報に基づいてクラスターの変更を判断できるようになります。
2025/07/21 - Amazon MSK now supports up to 5x more partitions on Express Brokers
Amazon Managed Streaming for Apache Kafka (Amazon MSK)のExpress Brokerにおいて、1ブローカーあたりのサポート可能なパーティション数が最大5倍に増加しました。パーティション数に制約されるワークロードの価格性能が最大50%向上し、より少ないブローカーでの運用が可能になります。例えば、m7g.16xlargeインスタンスでは、従来の4,000から最大20,000パーティションをサポートします。
また、クラスターの安定性を維持するため、パーティション数の上限も新たに設けられました。この機能強化は、多数のトピックを扱うアプリケーションなどに特に有効で、追加料金なしで利用可能です。
AWS Clean Rooms
新機能・アップデート
2025/07/01 - AWS Clean Rooms supports incremental and distributed training for custom modeling
AWS Clean Roomsは、機械学習機能を強化し、新たに「インクリメンタル・トレーニング」と「分散トレーニング」をサポートしました。インクリメンタル・トレーニングでは、既存の学習済みモデルを基盤に新しいモデルを構築できるため、トレーニング時間と計算リソースを大幅に削減します。一方、分散トレーニングは、複数のインスタンスに処理を分散させることで、大規模データセットを効率的に扱えるようになりました。
APIの変更点
2025/07/01 - AWS Clean Rooms ML - 1 new 16 updated methods
AWS Clean Rooms ML のカスタムモデルの増分トレーニングと分散トレーニングのサポートが導入されました。
2025/07/17 - AWS Clean Rooms ML - 2 updated methods
AWS Clean Rooms ML の ML 入力チャネルモデルに対する Parquet 結果形式のサポートが導入されました。
2025/08/01 - AWS Clean Rooms Service - 1 updated methods
既存の構成済みテーブル上のテーブル参照と許可された列を更新できるようになります。
Amazon S3 Tables
新機能・アップデート
2025/07/15 - Amazon S3 Tables now supports Model Context Protocol (MCP) Server
生成AIによるデータ管理を強化する「Model Context Protocol (MCP) Server for Amazon S3 Tables」を発表しました。このMCPサーバによって、AIコードアシスタントがS3 Tablesの機能や操作を文脈に沿って正確に理解できるようになります。
開発者やデータエンジニアは、自然言語を使ってテーブル作成、スキーマ定義、データのインポート/エクスポート、クエリ実行などを指示でき、データプロジェクトを自然言語で指示・操作可能です。
APIの変更点
2025/07/15 - Amazon S3 Tables - 2 updated methods
ListTableBucket および GetTableBucket API 操作にテーブル バケット タイプを追加します。
Amazon S3 Vectors
新機能・アップデート
2025/07/15 - Announcing Amazon S3 Vectors (Preview)—First cloud object storage with native support for storing and querying vectors
AWS Summit 2025 New Yorkにて、新しいS3の新サービス「Amazon S3 Vectors」のプレビューが発表されました。Amazon S3 Vectorsは、AIエージェントやセマンティック検索向けにコストを最適化したベクトルストレージです。ベクトルデータの保存やクエリにかかるコストを最大90%削減し、大規模データセットの活用を容易にすることで、AIの文脈理解や検索結果を向上させます。
S3と同等の拡張性と耐久性を持ちながら、サブ秒単位の高速クエリを実現。Amazon BedrockのRAG(Retrieval-Augmented Generation)やOpenSearch Serviceとも統合されており、コストを抑えつつ柔軟なデータ管理が可能です。専用APIによりインフラ管理も不要で、ビデオ検索や医療画像のパターン検出など、多様な用途に活用できます。
APIの変更点
2025/07/16 - Amazon S3 Vectors - 16 new methods
Amazon S3 Vectors は、意味と類似性に基づいたクエリに対して、コスト効率が高く、弾力性と耐久性に優れたベクトルストレージを提供します。
最後に
AWS Summit 2025 New Yorkにて、新しいS3の新サービス「Amazon S3 Vectors」のプレビューやSageMakerとAmazon QuickSightの統合など、新サービスや大きなアップデートが数々ありました。また、Amazon Q Developerをはじめとする AIコードアシスタントの広がりの中でAWSから様々なMCPサーバーも積極的に提供されていました。
なお、AWS Summit in New York 2025で発表された新サービスやアップデートなど、振り返りすることをおすすめします。