[re:Growth 2025 札幌] 「AWS re:Invent 2025 Data & AI Updates: 3つの潮流から読み解く、データ戦略の未来」というタイトルで登壇しました！ #regrowth_sapporo #AWSreInvent

AWS re:Invent 2025

2025.12.08

クラウド事業本部コンサルティング部の石川です。AWS re:Invent 2025で発表されたData & AI関連のサービスのアップデートについて、戦略的な視点から整理してお届けします。今年のre:Inventでは、キーノートでの派手な新サービス発表こそ少なかったものの、既存サービスの成熟度を示す重要なアップデートが多数発表されました。
本記事では、re:Invent直前の39件、期間中の12件を含む計51件のアップデートを、3つの戦略的な柱として整理し、AWSのデータプラットフォームが向かう方向性を読み解いていきます。
 登壇資料 Data & AI戦略の3つの柱今回のre:Invent 2025で発表されたアップデートを俯瞰すると、AWSのデータプラットフォーム戦略は以下の3つの柱に集約されます。
 1. AIネイティブなデータ基盤の構築生成AIワークロードを支えるため、ベクトル検索を中心としたインフラの高速化と低コスト化を徹底的に追求しています。
 2. AIによる自動化とZero-ETLによるデータ連携の簡素化Agentic AIを活用し、データ分類やバージョンアップといったデータエンジニアリングの定型業務を自動化。同時に、ETLパイプラインの構築・管理を不要にする取り組みが加速しています。
 3. Apache Icebergによるレイクハウスの標準化オープンフォーマットであるApache Icebergをエコシステムの中心に据え、あらゆるサービスが連携する統一データ基盤を構築する方向性が明確になりました。
それでは、各柱について詳しく見ていきましょう。
 第一の柱：AIネイティブなデータ基盤の構築 ベクトル検索の劇的な性能向上とコスト削減生成AIアプリケーションの中核を担うベクトル検索において、性能とコストの両面で大きな進化がありました。
 Amazon OpenSearch ServiceGPU accelerationにより、ベクトルインデックス構築が劇的に高速化されました：
最大10倍の高速化
コストを1/4に削減
数十億ベクトル規模のデータベースを短時間で構築可能に
さらに、Auto-optimization機能により、レイテンシ、品質、メモリの最適なバランスをAIが自動提案。チューニング作業の自動化により、エンジニアの負担を大幅に軽減します。
 Amazon S3 VectorsS3が本格的なベクトルストアとして進化しました：
バケットあたり最大20億ベクトルを格納可能
ベクトルのアップロード、保存、クエリにかかる総コストを最大90%削減
OpenSearch Serviceがレイテンシと機能を重視するのに対し、S3 Vectorsはコストとスケーラビリティを重視した選択肢として位置づけられます。この2つのサービスにより、RAGアプリケーションの要件に応じた柔軟なアーキテクチャ設計が可能になりました。
 第二の柱：AIによる自動化とZero-ETL Agentic AIによるデータライフサイクルの全方位支援データエンジニアリングのライフサイクル全体で、AIエージェントによる自動化が進んでいます。
 データ分類・発見：Amazon SageMaker CatalogAmazon BedrockのLLMを活用し、テーブルのスキーマ情報からビジネス用語集に基づいたデータ分類を自動化します。機密データ（PII/PHI）の特定も支援し、データガバナンスの負担を大幅に軽減します。
 運用・保守：Amazon EMRApache Spark upgrade agentの提供により、Sparkのバージョンアップ作業が革新的に改善されます。AIがアプリケーションコードを分析し、API変更を検知して修正を提案。これまで多大な労力を要していたバージョンアップ作業が大幅に効率化されます。
 開発・分析：Amazon SageMaker Notebook自然言語プロンプトからコードやSQLを生成する組み込みAIエージェントを搭載。データ分析や開発作業を加速し、技術的な障壁を下げます。
 ETLパイプライン不要の世界へデータ統合の複雑性を解消する取り組みも加速しています。
 AWS Glue Zero-ETL IntegrationSelf-managed Databases向けのサポートが拡充され、オンプレミスやEC2上のMySQL、PostgreSQL、OracleからAmazon RedshiftへのZero-ETL統合が可能になりました。また、SAP Entities向けのサポートも強化され、フルスナップショットや増分データロードに対応しています。
 Amazon CloudWatch Unified Managementサードパーティツールを含む様々なソースからの運用・セキュリティデータを、マネージドなETL不要のデータコレクタで集約・分析可能に。データは追加費用なしでAmazon S3 Tables（Icebergフォーマット）を利用してアクセスできます。
 第三の柱：Apache Icebergの進化と深化 Apache Iceberg V3のサポート開始Amazon EMR 7.12とAWS Glue 5.1で、Apache Iceberg V3のサポートが開始されました。V3の主要機能により、データパイプラインの性能と監査能力が大きく向上します。
 削除ベクトル（Deletion Vectors）ファイル全体を書き換えることなく、削除対象行をマークとして記録する仕組みです。これにより：
データパイプラインの高速化を実現
データコンパクションに伴うストレージコストを削減
 行レベルのリネージ機能（Row Lineage）各レコードの作成・変更履歴をメタデータとして自動追跡します：
SQLクエリのみでデータの変更履歴を追跡可能
監査要件やCDC（Change Data Capture）への対応が容易に
 Icebergが「共通ストレージフォーマット」へIcebergが単なるストレージフォーマットから、サービス間のデータ連携を司る中心的な役割へと進化しています。
 Amazon Redshift / Redshift ServerlessIcebergテーブルへの書き込みサポート
JIT ANALYZE機能によるIcebergテーブル統計情報の自動収集・更新でパフォーマンス改善
 Amazon CloudWatch / Amazon SageMaker Catalog運用データやアセットメタデータをS3 Tables（Iceberg）として出力
ETLなしで即座に分析可能
 AWS GlueIcebergベースのマテリアライズドビューに対応
クエリ結果をIcebergテーブルとして事前計算し、クエリリライトなどにより性能を最大8倍向上
リモートIcebergカタログのフェデレーション対応により、データを移動せず外部管理のIcebergテーブルに直接クエリ可能
 その他の主要アップデート データ処理・オーケストレーションAmazon EMR Serverlessでは、ローカルストレージを不要にし、中間データをマネージドなサーバレスストレージに保存。ジョブ失敗を回避しつつ、コストを最大20%削減します。
Amazon Athenaでは、キャパシティ予約のオートスケーリングが導入され、ワークロード需要に応じたDPUの自動スケールアップ/ダウンが可能になりました。
Amazon MWAA Serverlessが発表され、フルマネージドのAirFlowをサーバーレスでデプロイ可能に。インフラのプロビジョニングやスケーリングが不要になります。
Amazon MSKでは、インテリジェント・リバランシングにより、パーティションリバランスが自動化され、従来比で最大180倍高速に実行できるようになりました。
 BI、ガバナンス、オブザーバビリティAmazon Quick Suiteでは、QuickFlowsのスケジュール実行やQuickChatのアプリケーション埋め込みなど、自動化と開発者向け機能が強化されました。
AWS Clean Roomsには、元データの統計的特徴を維持したまま匿名化されたデータセットを生成する合成データ生成機能が追加されました。
AWS Lake Formationでは、監査コンテキストサポートが追加され、EMRとGlueのジョブ実行時のコンテキストをCloudTrailログに記録し、追跡を強化しています。
Amazon OpenSearch ServiceのAgentic Searchでは、AIエージェントが自然言語の意図を解釈し、最適な検索戦略を適用。推論プロセスを説明しながら結果を提供します。
 最後にAWS re:Invent 2025のData & AIアップデートは、AIワークロードに最適化された高速・低コストな基盤の上で、AI自身がデータエンジニアリングの複雑性を解消し、すべてがオープンな標準で相互接続されるという明確なビジョンを示しています。
これらのアップデートは、単なる機能追加ではなく、データプラットフォームの未来を示す戦略的な動きです。特にApache Icebergを中心としたエコシステムの統一は、ベンダーロックインを避けつつ、柔軟で強力なデータ基盤を構築できる可能性を示しています。
今後も、これらのアップデートの詳細や実践的な活用方法について、クラスメソッド データアナリティクス通信で継続的にお届けしていきます。
 参考資料https://dev.classmethod.jp/articles/cm-news-analytics-202512/

[re:Growth 2025 札幌] 「AWS re:Invent 2025 Data & AI Updates: 3つの潮流から読み解く、データ戦略の未来」というタイトルで登壇しました！ #regrowth_sapporo #AWSreInvent

登壇資料

Data & AI戦略の3つの柱

1. AIネイティブなデータ基盤の構築

2. AIによる自動化とZero-ETLによるデータ連携の簡素化

3. Apache Icebergによるレイクハウスの標準化

第一の柱：AIネイティブなデータ基盤の構築

ベクトル検索の劇的な性能向上とコスト削減

Amazon OpenSearch Service

Amazon S3 Vectors

第二の柱：AIによる自動化とZero-ETL

Agentic AIによるデータライフサイクルの全方位支援

データ分類・発見：Amazon SageMaker Catalog

運用・保守：Amazon EMR

開発・分析：Amazon SageMaker Notebook

ETLパイプライン不要の世界へ

AWS Glue Zero-ETL Integration

Amazon CloudWatch Unified Management

第三の柱：Apache Icebergの進化と深化

Apache Iceberg V3のサポート開始

削除ベクトル（Deletion Vectors）

行レベルのリネージ機能（Row Lineage）

Icebergが「共通ストレージフォーマット」へ

Amazon Redshift / Redshift Serverless

Amazon CloudWatch / Amazon SageMaker Catalog

AWS Glue

その他の主要アップデート

データ処理・オーケストレーション

BI、ガバナンス、オブザーバビリティ

最後に

参考資料

関連記事

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

EVENTS