[re:Growth 2025 札幌] 「AWS re:Invent 2025  Data & AI Updates: 3つの潮流から読み解く、データ戦略の未来」というタイトルで登壇しました! #regrowth_sapporo #AWSreInvent

[re:Growth 2025 札幌] 「AWS re:Invent 2025 Data & AI Updates: 3つの潮流から読み解く、データ戦略の未来」というタイトルで登壇しました! #regrowth_sapporo #AWSreInvent

2025.12.08

クラウド事業本部コンサルティング部の石川です。AWS re:Invent 2025で発表されたData & AI関連のサービスのアップデートについて、戦略的な視点から整理してお届けします。今年のre:Inventでは、キーノートでの派手な新サービス発表こそ少なかったものの、既存サービスの成熟度を示す重要なアップデートが多数発表されました。

本記事では、re:Invent直前の39件、期間中の12件を含む計51件のアップデートを、3つの戦略的な柱として整理し、AWSのデータプラットフォームが向かう方向性を読み解いていきます。

登壇資料

Data & AI戦略の3つの柱

今回のre:Invent 2025で発表されたアップデートを俯瞰すると、AWSのデータプラットフォーム戦略は以下の3つの柱に集約されます。

1. AIネイティブなデータ基盤の構築

生成AIワークロードを支えるため、ベクトル検索を中心としたインフラの高速化と低コスト化を徹底的に追求しています。

2. AIによる自動化とZero-ETLによるデータ連携の簡素化

Agentic AIを活用し、データ分類やバージョンアップといったデータエンジニアリングの定型業務を自動化。同時に、ETLパイプラインの構築・管理を不要にする取り組みが加速しています。

3. Apache Icebergによるレイクハウスの標準化

オープンフォーマットであるApache Icebergをエコシステムの中心に据え、あらゆるサービスが連携する統一データ基盤を構築する方向性が明確になりました。

それでは、各柱について詳しく見ていきましょう。

第一の柱:AIネイティブなデータ基盤の構築

ベクトル検索の劇的な性能向上とコスト削減

生成AIアプリケーションの中核を担うベクトル検索において、性能とコストの両面で大きな進化がありました。

Amazon OpenSearch Service

GPU accelerationにより、ベクトルインデックス構築が劇的に高速化されました:

  • 最大10倍の高速化
  • コストを1/4に削減
  • 数十億ベクトル規模のデータベースを短時間で構築可能に

さらに、Auto-optimization機能により、レイテンシ、品質、メモリの最適なバランスをAIが自動提案。チューニング作業の自動化により、エンジニアの負担を大幅に軽減します。

Amazon S3 Vectors

S3が本格的なベクトルストアとして進化しました:

  • バケットあたり最大20億ベクトルを格納可能
  • ベクトルのアップロード、保存、クエリにかかる総コストを最大90%削減

OpenSearch Serviceがレイテンシと機能を重視するのに対し、S3 Vectorsはコストとスケーラビリティを重視した選択肢として位置づけられます。この2つのサービスにより、RAGアプリケーションの要件に応じた柔軟なアーキテクチャ設計が可能になりました。

第二の柱:AIによる自動化とZero-ETL

Agentic AIによるデータライフサイクルの全方位支援

データエンジニアリングのライフサイクル全体で、AIエージェントによる自動化が進んでいます。

データ分類・発見:Amazon SageMaker Catalog

Amazon BedrockのLLMを活用し、テーブルのスキーマ情報からビジネス用語集に基づいたデータ分類を自動化します。機密データ(PII/PHI)の特定も支援し、データガバナンスの負担を大幅に軽減します。

運用・保守:Amazon EMR

Apache Spark upgrade agentの提供により、Sparkのバージョンアップ作業が革新的に改善されます。AIがアプリケーションコードを分析し、API変更を検知して修正を提案。これまで多大な労力を要していたバージョンアップ作業が大幅に効率化されます。

開発・分析:Amazon SageMaker Notebook

自然言語プロンプトからコードやSQLを生成する組み込みAIエージェントを搭載。データ分析や開発作業を加速し、技術的な障壁を下げます。

ETLパイプライン不要の世界へ

データ統合の複雑性を解消する取り組みも加速しています。

AWS Glue Zero-ETL Integration

Self-managed Databases向けのサポートが拡充され、オンプレミスやEC2上のMySQL、PostgreSQL、OracleからAmazon RedshiftへのZero-ETL統合が可能になりました。また、SAP Entities向けのサポートも強化され、フルスナップショットや増分データロードに対応しています。

Amazon CloudWatch Unified Management

サードパーティツールを含む様々なソースからの運用・セキュリティデータを、マネージドなETL不要のデータコレクタで集約・分析可能に。データは追加費用なしでAmazon S3 Tables(Icebergフォーマット)を利用してアクセスできます。

第三の柱:Apache Icebergの進化と深化

Apache Iceberg V3のサポート開始

Amazon EMR 7.12とAWS Glue 5.1で、Apache Iceberg V3のサポートが開始されました。V3の主要機能により、データパイプラインの性能と監査能力が大きく向上します。

削除ベクトル(Deletion Vectors)

ファイル全体を書き換えることなく、削除対象行をマークとして記録する仕組みです。これにより:

  • データパイプラインの高速化を実現
  • データコンパクションに伴うストレージコストを削減

行レベルのリネージ機能(Row Lineage)

各レコードの作成・変更履歴をメタデータとして自動追跡します:

  • SQLクエリのみでデータの変更履歴を追跡可能
  • 監査要件やCDC(Change Data Capture)への対応が容易に

Icebergが「共通ストレージフォーマット」へ

Icebergが単なるストレージフォーマットから、サービス間のデータ連携を司る中心的な役割へと進化しています。

Amazon Redshift / Redshift Serverless

  • Icebergテーブルへの書き込みサポート
  • JIT ANALYZE機能によるIcebergテーブル統計情報の自動収集・更新でパフォーマンス改善

Amazon CloudWatch / Amazon SageMaker Catalog

  • 運用データやアセットメタデータをS3 Tables(Iceberg)として出力
  • ETLなしで即座に分析可能

AWS Glue

  • Icebergベースのマテリアライズドビューに対応
  • クエリ結果をIcebergテーブルとして事前計算し、クエリリライトなどにより性能を最大8倍向上
  • リモートIcebergカタログのフェデレーション対応により、データを移動せず外部管理のIcebergテーブルに直接クエリ可能

その他の主要アップデート

データ処理・オーケストレーション

Amazon EMR Serverlessでは、ローカルストレージを不要にし、中間データをマネージドなサーバレスストレージに保存。ジョブ失敗を回避しつつ、コストを最大20%削減します。

Amazon Athenaでは、キャパシティ予約のオートスケーリングが導入され、ワークロード需要に応じたDPUの自動スケールアップ/ダウンが可能になりました。

Amazon MWAA Serverlessが発表され、フルマネージドのAirFlowをサーバーレスでデプロイ可能に。インフラのプロビジョニングやスケーリングが不要になります。

Amazon MSKでは、インテリジェント・リバランシングにより、パーティションリバランスが自動化され、従来比で最大180倍高速に実行できるようになりました。

BI、ガバナンス、オブザーバビリティ

Amazon Quick Suiteでは、QuickFlowsのスケジュール実行やQuickChatのアプリケーション埋め込みなど、自動化と開発者向け機能が強化されました。

AWS Clean Roomsには、元データの統計的特徴を維持したまま匿名化されたデータセットを生成する合成データ生成機能が追加されました。

AWS Lake Formationでは、監査コンテキストサポートが追加され、EMRとGlueのジョブ実行時のコンテキストをCloudTrailログに記録し、追跡を強化しています。

Amazon OpenSearch ServiceAgentic Searchでは、AIエージェントが自然言語の意図を解釈し、最適な検索戦略を適用。推論プロセスを説明しながら結果を提供します。

最後に

AWS re:Invent 2025のData & AIアップデートは、AIワークロードに最適化された高速・低コストな基盤の上で、AI自身がデータエンジニアリングの複雑性を解消し、すべてがオープンな標準で相互接続されるという明確なビジョンを示しています。

これらのアップデートは、単なる機能追加ではなく、データプラットフォームの未来を示す戦略的な動きです。特にApache Icebergを中心としたエコシステムの統一は、ベンダーロックインを避けつつ、柔軟で強力なデータ基盤を構築できる可能性を示しています。

今後も、これらのアップデートの詳細や実践的な活用方法について、クラスメソッド データアナリティクス通信で継続的にお届けしていきます。

参考資料

https://dev.classmethod.jp/articles/cm-news-analytics-202512/

この記事をシェアする

FacebookHatena blogX

関連記事