![[リアルタイム更新] Infrastructure Innovations with Peter DeSantis and Dave Brown Keynote まとめ #AWSreInvent #KEY004](https://devio2024-media.developers.io/image/upload/f_auto,q_auto,w_3840/v1764877952/user-gen-eyecatch/dictvsxylifj5l21mgqy.jpg)
[リアルタイム更新] Infrastructure Innovations with Peter DeSantis and Dave Brown Keynote まとめ #AWSreInvent #KEY004
あしざわです。
AWS re:Invent 2025に現地参加しています。
本記事では、AWS SVP のPeter DeSantis氏とCompute and Machine Learning Vice PresidentであるDave Brown氏の基調講演をまとめます。
今年はどのようなテクノロジーが紹介されるのでしょうか?
※本記事は、基調講演聴講中にリアルタイムで更新されます
基調講演概要
Peter DesantisはAWS創業時から変わらないコア属性について語りました。
Security(悪意のある者もAIを使う時代において最優先)、Availability(10年間厳しいワークロードを動かし続けた実績)、Elasticity(AIワークロードによるキャパシティ急増への対応)、Cost(AIの高コストに対する継続的な投資と最適化)、Agility(クラウド採用企業の迅速なイノベーション)、そしてこれらを実現するビルディングブロックの提供です。
2010年のEC2初期、仮想化レイヤーによるJitter問題が課題でした。AWSはNitro Systemの開発により、この問題を完全に解決し、セキュリティと性能を大幅に向上させました。
Nitroで得た知見を活かし、設計されたのがGravitonプロセッサーです。高性能を低コストで提供し、SAPのHANAクラウドなどで採用されています。
チップ開発の反復的で長期的な取り組みという文脈でGravitonの進化が語られました。AWSは新しいチップが出るたびに改善を繰り返しています。
Graviton3ではキャッシュミスが性能を左右する課題に取り組み、Graviton4ではL2キャッシュのメモリ容量が増加し全体の性能向上に貢献したが、トレードオフでL2キャッシュのミスが増加してしまいました。
そして今回 AWS Graviton 5 および Amazon EC2 M9g インスタンス がプレビューリリースされました。M9gインスタンスは単一パッケージに 192 コアを搭載しており、コア間通信のレイテンシーが最大 33% 削減します。
冷却技術の革新も紹介されました。シリコンに直接触れる冷却方式により、TIM層を削減し、消費電力を33%削減しています。
2013年「サーバーがなかったら」という発想からLambdaが生まれました。Lambdaの誕生は単なる新サービスではなく、サーバーをすべて取り除く(サーバレス)という新しいアプリケーションモデルの誕生を意味します。
そして今回 AWS Lambda Managed Instance が発表されました。これはサーバレスからの逸脱ではなく拡張です。LambdaのシンプルさとEC2のパワーを同時に提供し、開発者がコードとビジネスロジックに完全に集中できるようにします。
続いて、Amazon Bedrockを支えるProject Mantleが紹介されました。現在のBedrockではレイテンシを顧客が指定できるよう、Priority、Standard、Flexの3つのサービスTierを用意しています。共有システムにおける公平性を確保するため、専用キューを準備し、キャパシティを予測・確保しています。
DynamoDBやS3を支えるトランザクションログであるジャーナル機能はBedrockでも採用されており、ハードウェア障害時でも失敗した地点から再開できます。ファインチューニングでは、Confidential Computingにより、セキュリティとプライバシーを確保しています。IAMやCloudWatchなどとの統合により、20年近い運用知見が活かされています。
ベクターとは各次元に意味のあるデータポイントで、実世界では3000次元にもなります。既存の埋め込みモデルでは、非構造化データを検索する場合複数のモデルを使う必要があり、フォーマットを跨いで検索する簡単な方法がありませんでした。
先日AWSはAmazon Nova Multimodal Embeddings という最新鋭の埋め込みモデルを発表し、業界トップクラスの性能を実現しました。
Amazon OpenSearch Serviceには、完全一致検索とセマンティック検索の長所を生かした関連性検索が追加されています。
そして、Amazon S3 Vectors の一般提供開始 が発表されました。S3 Vectors は専用のベクターデータベースソリューションと比較して、ベクターの保存とクエリにかかる総コストを最大 90% 削減できます。
AIワークロードの爆発的増加に対応するため、Trainium 3が40%のコスト削減を実現しています。これは数百億ドル規模のインパクトです。
CEO Keynoteで発表されたTrainium 3 Ultraserverでは、144個のTrainium 3チップ、Neuron Switch(低レイテンシー設計の専用ネットワークスイッチ)により、360ペタフロップスの性能、20TB HBMキャパシティ、毎秒700テラバイトの帯域を実現しています。
設計の特徴として、4つのTrainiumチップ、1つのGravitonチップ、2つのNitroチップから構成されています。また、マイクロスケーリングなど、ベンチマークではなく顧客の実ワークロードにこだわった最適化を行っています。
全体を通して、AIがインフラにとって何を意味するのか5つの軸で話したが、これはAI登場以前から重要なものです。
後ほどの開催されるWarner Keynoteでは「AWSが次に何を作るのか」について語られるのを楽しみにしてください、という言葉で締め括られました。
発表された新サービス
AWS Graviton 5 のプレビュー
Amazon EC2 M9g Instances のプレビュー
AWS Lambda Managed Instance の発表
Amazon S3 Vectors の一般提供開始
まとめ
これまでAWSが何に集中し何を作ってきたのか、過去から現在にフォーカスして技術にDeep Diveするという、基調講演らしいセッションだと感じました。
インフラの観点ではAIの登場がAWSに何か新しいことを始めさせたのではなく、これまでの20年と変わらない大事なことに集中しているだけ、というメッセージを強く感じました。
本日現地時間の午後3:30〜開催されるDr. Warner Keynoteでは、本Keynoteとは対照的な「これからAWSは何を作るのか」という未来にフォーカスした基調講演とのことです。
残りのKeynoteも楽しみましょう!
以上です。








