[アップデート] Amazon S3 Vectors が1クエリ最大10,000件(従来比100倍)の類似検索結果取得をサポートしました
クラウド事業本部の石川です。Amazon S3 Vectors で、1 回の類似検索クエリで取得できる結果数の上限が、従来の 100 件から最大 10,000 件へと 100 倍に拡大されました。
再ランキングや重複排除といった後段処理を前提とした、マルチステージ検索パイプラインを構築している方にとって、より広い候補セットを 1 クエリで取得できる嬉しいアップデートです。
1クエリ最大10,000件(従来比100倍)の類似検索結果取得とは
今回のアップデートにより、QueryVectors API の topK(取得する近傍ベクトル数)に最大 10,000 を指定できるようになりました。
主な変更点は以下のとおりです。
- 1 クエリあたりの最大結果数が、従来の 100 件から 10,000 件へと 100 倍に拡大
QueryVectorsAPI リクエストで、topK(top-K nearest neighbors)に最大 10,000 を指定可能- クエリ結果は複数ページに分割されて返却され、最初のページをすぐに処理しながら、必要に応じて後続ページを取得可能
- より広く包括的な候補セットを取得できるため、再ランキング・集約・重複排除などの追加処理に活用しやすくなる
より多くの候補を 1 クエリで取得できるようになったことで、検索結果を取得した後に再ランキングやフィルタリングを行う「マルチステージ検索パイプライン」を、より少ない API 呼び出しで効率的に構築できます。
料金への影響
クエリで返却されたデータ量に応じた「data-returned fee(データ返却料金)」が発生します。
- 1 クエリあたり最初の 512 KB の返却データは無料
- 512 KB を超えた分について、返却された結果の合計サイズに基づき課金(執筆時点で $0.01/GB)
- 各結果は、ルックアップと返却のコストを反映して最低 256 バイトとして課金
正確な料金は利用リージョンや時期によって変動する可能性があるため、最新の情報は S3 の料金ページをご確認ください。
Top-k を 10,000 に拡大できると何が嬉しいのか
ベクトル検索(近似最近傍探索: ANN)は高速な一方で、あくまで「近似」であり、関連度の高い結果が必ずしも上位 100 件に収まるとは限りません。topK の上限が 100 件だった頃は、ここが検索品質の天井になりがちでした。最大 10,000 件まで取得できるようになったことで、以下のようなマルチステージ検索パイプラインが組みやすくなります。
- **再ランキング(リランク)**の候補を増やし、最終精度を上げる
- ハイブリッド検索・複数結果のフュージョンに活用できる
- メタデータフィルタ・重複排除の後でも十分な件数を残せる
- 集約・推薦・網羅検索など「多く返したい」用途にそのまま対応
なお、Top-k を大きくするほど返却データ量・レイテンシ・コストは増えます。「広く取って、後段で賢く絞る」を基本に、ユースケースに必要十分な候補数を見極めることが重要です。大量の結果はページごとに返却されるため、最初のページを処理しながら後続ページを取得していく形になります。すべてのページを取得する際の具体的な実装方法は、利用する SDK のバージョンによって異なるため、最新の SDK リファレンスに従ってください。
利用上の注意
- 本機能を利用するには最新の AWS SDK へのアップデートが必要です
- 結果数を大きくすると返却データ量も増え、512 KB の無料枠を超えた分は data-returned fee の対象になります。必要十分な
topKを設定することがコスト最適化につながります - S3 Vectors は頻度の低いクエリに最適化されたサービスです。高 QPS・低レイテンシが求められるワークロードでは、Amazon OpenSearch Service との連携も検討してください
最後に
Amazon S3 Vectors の 1 クエリあたりの結果取得上限が、従来の 100 件から最大 10,000 件へと 100 倍に拡大されました。QueryVectors API の topK に最大 10,000 を指定でき、結果はページ分割で返却されます。料金は返却データ量ベースで、最初の 512 KB は無料です。
再ランキングや重複排除を伴うマルチステージ検索パイプラインや RAG アプリケーションを構築されている方は、最新の AWS SDK へ更新のうえ、より広い候補セットを活用した検索精度の向上を検討してみてはいかがでしょうか。






