[アップデート] Amazon S3 Vectors が大規模ベクトルインデックスのクエリ処理料金を最大 80% 削減しました
クラウド事業本部の石川です。Amazon S3 Vectors において、1,000 万を超えるベクトルを持つインデックスに対するクエリ処理料金(data processed の料金)が、最大 80% 削減されました。
大規模な AI・RAG・セマンティック検索ワークロードを運用している方にとって、ランニングコストをさらに引き下げられる嬉しいアップデートです。しかもアプリケーション側の変更は不要で、自動的に適用されます。
アップデート内容
今回のアップデートは、S3 Vectors のクエリにかかる「data processed(処理データ量)」の料金引き下げです。
主な変更点は以下のとおりです。
- 1,000 万を超えるベクトルを持つ大規模インデックスに対するクエリ処理料金(data processed)を、最大 80% 削減
- アプリケーション側の変更は不要で、自動的に新しい料金が適用される
- 大規模インデックスでもコストが下がる一方、クエリパフォーマンス向上のため、引き続き複数インデックスへのベクトル分散が推奨される
対応リージョン
料金改定は、S3 Vectors が利用可能なすべての AWS リージョンで、発表日(2026 年 6 月 16 日)より有効です。**S3 Vectors はアジアパシフィック(東京)・アジアパシフィック(大阪)**を含む各リージョンで利用可能です。
料金への影響
クエリ処理料金が下がるため、特に大規模インデックスを対象とした類似検索のコストが低減します。具体的な単価は「S3 pricing page」を必ず確認してください。
S3 Vectors のクエリ料金の仕組み
今回のアップデートの意味を理解するために、まず S3 Vectors のクエリ料金の構成を整理します。クエリ 1 回あたりの料金は、大きく次の 3 つの要素で構成されています。
**ポイントは「data processed(データ処理課金)」**です。S3 Vectors の data processed は、平均ベクトルサイズ(ベクトルデータ+キー+フィルタ可能メタデータ)× インデックス内のベクトル数 で算出されます。つまり、インデックスに格納されているベクトルが多いほど、1 回のクエリで処理されるデータ量も大きくなり、料金が高くなる構造です。
この **data processed は、ベクトル数に応じた階層制(ボリュームディスカウント)**になっています。今回のアップデートでは、最も大規模な「1,000 万ベクトル超」の階層の単価が引き下げられ、最大 80% の削減効果が得られるようになりました。大量のベクトルを 1 つのインデックスに集約しているワークロードほど、恩恵が大きくなります。
参考:現行の料金単価
参考として、2026 年 6 月時点・アジアパシフィック(東京)リージョン(ap-northeast-1)の S3 Vectors の料金単価は以下のとおりです。料金は変更される可能性があるため、最新の値は必ず「S3 pricing page」(Vectors タブでリージョンに「Asia Pacific (Tokyo)」を選択)で確認してください。
| 項目 | 単価(参考・東京リージョン / ap-northeast-1) |
|---|---|
| ベクトルストレージ | $0.066 / GB・月 |
| アップロード(PUT) | $0.219 / GB(1 PUT あたり最小 128KB 課金) |
| リクエスト(GET / LIST など、PUT・クエリ以外) | $0.06 / 1,000 リクエスト |
| クエリ(リクエスト課金) | $0.0027 / 1,000 クエリ(≒ $2.70 / 100 万クエリ) |
| クエリ(data processed:最初の 10 万ベクトル) | $0.0044 / TB |
| クエリ(data processed:10 万〜1,000 万ベクトル) | $0.0022 / TB |
| クエリ(data processed:1,000 万ベクトル超) | $0.00044 / TB |
| 返却データ | $0.01 / GB(クエリごとに最初の 512KB は無料。各結果は最低 256 バイト課金) |
大規模インデックスでも分散が推奨される理由
「料金が下がったなら、すべてを 1 つの巨大インデックスに入れればよいのでは」と考えたくなりますが、AWS は引き続き複数インデックスへのベクトル分散を推奨しています。
これは data processed の計算式を踏まえると理解しやすくなります。1 つのインデックスにベクトルを集約するほど、1 回のクエリで処理されるデータ量(=平均ベクトルサイズ × ベクトル数)が増え、クエリレイテンシーに影響します。アクセスパターンやテナント、用途ごとにインデックスを分けておくことで、各クエリが走査する対象を絞り込み、クエリパフォーマンスを高く保てます。
今回の料金引き下げは「大規模インデックスのコスト負担を軽くする」ものであり、「分散しなくてよくなった」という意味ではない点に注意してください。コスト最適化とパフォーマンス最適化は別の観点として、引き続きインデックス設計を検討することをおすすめします。
利用上の注意
- 今回の削減対象は、あくまでクエリの data processed 料金 です。ストレージ料金・アップロード(PUT)料金・リクエスト課金は対象外です。
- 削減効果が最大化されるのは、1,000 万ベクトルを超える大規模インデックスです。それ以下の規模では効果が限定的、または対象外となります。
- 料金単価や対象リージョンは変更される可能性があります。試算の際は必ず最新の公式ページを確認してください。
最後に
Amazon S3 Vectors のクエリ処理料金(data processed)が、1,000 万ベクトルを超える大規模インデックスを対象に最大 80% 削減されました。アプリケーションの変更は不要で、S3 Vectors が利用可能なすべてのリージョンに自動適用されます。
大量のベクトルを扱う RAG・セマンティック検索・AI エージェントメモリなどのワークロードでは、運用コストをさらに引き下げられる可能性があります。すでに S3 Vectors を利用している方は現在のコスト構造を見直し、これから検討する方はコスト試算の前提として今回の改定を取り込んでみてはいかがでしょうか。










