RDS Proxyが拡張クエリプロトコルに対応し、ピン留めの発生条件が緩和されました
本日のアップデートによりRDS ProxyがPostgreSQLの拡張クエリプロトコルをサポートするようになりました。本ブログではこのアップデートについてご紹介します。
- 簡易クエリプロトコルの場合
select user = 'postgres'
- 拡張クエリプロトコルの場合
select user = $1
拡張クエリプロトコルを使うとPREPARED STATEMENTと同様にSQLインジェクションのリスクヘッジや、SQL文のパース結果再利用によるパフォーマンス向上などが期待できるため、PostgreSQL向けの各種DBドライバやライブラリは拡張クエリプロトコルを利用しているケースが多いです。
前述のように拡張クエリプロトコルにはセキュリティやパフォーマンスの面でメリットがあるのですが、RDS Proxyに対して拡張クエリプロトコルを利用してしまうと、当該DBセッションがピン留めされてしまい複数のクライアント間でDBとの物理接続を共有できなくなるという課題がありました。
ピン留めが発生するとRDS Proxyを利用するメリットが薄れてしまうため、拡張クエリプロトコルを利用しないようにしたいところではあるのですが、そうなると今度はセキュリティやパフォーマンスのメリットが犠牲になってしまいます。また、アプリケーション側の実装が煩雑になるというデメリットもあります。アプリケーションの開発にORMを利用するケースは多いと思いますが、拡張クエリプロトコルの利用を回避しようとするとORMの便利な処理がそのまま利用できなくなり、生SQLを書くに近い低レベルな実装が必要になることが多く、開発生産性に悪影響を及ぼします。
const pet = connection.getRepository(Pet).findOne(PetId)
const pet = connection.getRepository(Pet).findOne({ where: `pet_id = ‘${PetId}’` })
RDS Proxyの「拡張されたログ記録」を有効にした状態で実際に拡張クエリプロトコルがピン留め対象にならないことを確認してみましょう。
- RDS for PostgreSQL: 15.3-R2
- デフォルトから以下のパラメータを変更
- log_statement: all
- rds.force_ssl: 0
- Node.js: v18.18.2
- pg: 8.11.3
Preprare Statementを利用してピン留めが発生することを確認
まずは普通にPreprare Statementを利用してピン留めが発生することを確認してみます。
psqlを使ってRDS Proxy経由でRDSに接続し、Preprare Statementを実行してみます。なおpsqlからのクエリ発行は簡易クエリプロトコルになります。
postgres=> prepare test as select user = $1; PREPARE postgres=> execute test('postgres'); ?column? ---------- t (1 row)
RDS Proxyのログを確認するとピン留めが発生したことが分かります。
2023-11-11T03:04:26.822Z [WARN] [proxyEndpoint=default] [clientConnection=489382254] The client session was pinned to the database connection [dbConnection=4017617057] for the remainder of the session. The proxy can't reuse this connection until the session ends. Reason: SQL changed session settings that the proxy doesn't track. Consider moving session configuration to the proxy's initialization query. Digest: "prepare test as select user = $1;".
以下のコードを使って、検証用のEC2からRDS Proxyに接続してクエリを発行してみます。
const pg = require('pg') async function main(){ const client = new pg.Client({ host: '<RDS Proxyのエンドポイント>', database: 'postgres', user: 'postgres', password: '<パスワード>', }) await client.connect() await client.query('SELECT user = $1', ['postgres']) await client.end() } main()
2023-11-11 03:36:22 UTC:[4548]:LOG: duration: 0.052 ms parse <unnamed>: DEALLOCATE ALL 2023-11-11 03:36:22 UTC:[4548]:LOG: duration: 0.008 ms bind <unnamed>: DEALLOCATE ALL 2023-11-11 03:36:22 UTC:[4548]:LOG: execute <unnamed>: DEALLOCATE ALL 2023-11-11 03:36:22 UTC:[4548]:LOG: duration: 0.015 ms 2023-11-11 03:36:22 UTC:[4548]:LOG: duration: 0.045 ms parse <unnamed>: SELECT user = $1 2023-11-11 03:36:22 UTC:[4548]:LOG: duration: 0.040 ms bind <unnamed>: SELECT user = $1 2023-11-11 03:36:22 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 03:36:22 UTC:[4548]:LOG: execute <unnamed>: SELECT user = $1 2023-11-11 03:36:22 UTC:[4548]:DETAIL: parameters: $1 = 'postgres'
RDS Proxyのログです。ピン留めは発生していないことが分かります。やったぜ!
2023-11-11T03:36:22.316Z [INFO] [proxyEndpoint=default] [clientConnection=2051681955] A new client connected from 2023-11-11T03:36:22.316Z [DEBUG] [proxyEndpoint=default] [clientConnection=2051681955] Received Startup Message: [username="postgres", database="postgres", protocolMajorVersion=3, protocolMinorVersion=0, sslEnabled=false] 2023-11-11T03:36:22.349Z [DEBUG] [proxyEndpoint=default] [clientConnection=2051681955] Proxy authentication with PostgreSQL native password authentication succeeded for user "postgres" with TLS off. 2023-11-11T03:36:22.355Z [DEBUG] [proxyEndpoint=default] [clientConnection=2051681955] The client connection borrowed the database connection [dbConnection=610606420] for the next query/transaction. 2023-11-11T03:36:22.363Z [DEBUG] [proxyEndpoint=default] [clientConnection=2051681955] The database connection [dbConnection=610606420] borrowed from the connection pool is being released to the connection pool. 2023-11-11T03:36:22.367Z [INFO] [proxyEndpoint=default] [clientConnection=2051681955] The client connection closed. Reason: The client requested that the connection close.
先程はunnamedなPREPARED STATEMENTで試したので、今度は名前付きのクエリで試してみます。以下のようにコードを修正して再度実行してみます。
const pg = require('pg') async function main(){ const client = new pg.Client({ host: '<RDS Proxyのエンドポイント>', database: 'postgres', user: 'postgres', password: '<パスワード>', }) await client.connect() await client.query({ name: 'test', text: 'SELECT user = $1', values: ['postgres'] }) await client.end() } main()
2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.025 ms parse <unnamed>: DEALLOCATE ALL 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.008 ms bind <unnamed>: DEALLOCATE ALL 2023-11-11 03:43:37 UTC:[4548]:LOG: execute <unnamed>: DEALLOCATE ALL 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.015 ms 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.064 ms parse test: SELECT user = $1 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.041 ms bind test: SELECT user = $1 2023-11-11 03:43:37 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 03:43:37 UTC:[4548]:LOG: execute test: SELECT user = $1 2023-11-11 03:43:37 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.022 ms
RDS Proxyのログは以下の通りです。ピン留めが発生するかなと予想していたのですが、ピン留めは発生しませんでした!
2023-11-11T03:43:37.414Z [INFO] [proxyEndpoint=default] [clientConnection=2880091403] A new client connected from 2023-11-11T03:43:37.415Z [DEBUG] [proxyEndpoint=default] [clientConnection=2880091403] Received Startup Message: [username="postgres", database="postgres", protocolMajorVersion=3, protocolMinorVersion=0, sslEnabled=false] 2023-11-11T03:43:37.442Z [DEBUG] [proxyEndpoint=default] [clientConnection=2880091403] Proxy authentication with PostgreSQL native password authentication succeeded for user "postgres" with TLS off. 2023-11-11T03:43:37.447Z [DEBUG] [proxyEndpoint=default] [clientConnection=2880091403] The client connection borrowed the database connection [dbConnection=610606420] for the next query/transaction. 2023-11-11T03:43:37.450Z [DEBUG] [proxyEndpoint=default] [clientConnection=2880091403] The database connection [dbConnection=610606420] borrowed from the connection pool is being released to the connection pool. 2023-11-11T03:43:37.454Z [INFO] [proxyEndpoint=default] [clientConnection=2880091403] The client connection closed. Reason: The client requested that the connection close.
nameを指定した場合もピン留めが発生しなかったため、RDS Proxyにコネクションが返却されるタイミングについてもう少し詳しく確認してみます。先程のクエリ発行部分を以下のように修正します。これでtestという名前のクエリ実行後に10秒待機を2回繰り返すことになります。
await client.query({ name: 'test', text: 'SELECT user = $1', values: ['postgres'] }) await new Promise(resolve => setTimeout(resolve, 10000)) await client.query({ name: 'test', text: 'SELECT user = $1', values: ['postgres'] }) await new Promise(resolve => setTimeout(resolve, 10000))
今回はRDS Proxyのログを先に確認してみます。
2023-11-11T04:18:12.332Z [INFO] [proxyEndpoint=default] [clientConnection=2034744493] A new client connected from 2023-11-11T04:18:12.332Z [DEBUG] [proxyEndpoint=default] [clientConnection=2034744493] Received Startup Message: [username="postgres", database="postgres", protocolMajorVersion=3, protocolMinorVersion=0, sslEnabled=false] 2023-11-11T04:18:12.361Z [DEBUG] [proxyEndpoint=default] [clientConnection=2034744493] Proxy authentication with PostgreSQL native password authentication succeeded for user "postgres" with TLS off. 2023-11-11T04:18:12.368Z [DEBUG] [proxyEndpoint=default] [clientConnection=2034744493] The client connection borrowed the database connection [dbConnection=610606420] for the next query/transaction. 2023-11-11T04:18:12.372Z [DEBUG] [proxyEndpoint=default] [clientConnection=2034744493] The database connection [dbConnection=610606420] borrowed from the connection pool is being released to the connection pool. 2023-11-11T04:18:22.380Z [DEBUG] [proxyEndpoint=default] [clientConnection=2034744493] The client connection borrowed the database connection [dbConnection=610606420] for the next query/transaction. 2023-11-11T04:18:22.382Z [DEBUG] [proxyEndpoint=default] [clientConnection=2034744493] The database connection [dbConnection=610606420] borrowed from the connection pool is being released to the connection pool. 2023-11-11T04:18:32.396Z [INFO] [proxyEndpoint=default] [clientConnection=2034744493] The client connection closed. Reason: The client requested that the connection close.
検証用コードの方では1回目のクエリ実行〜2回目のクエリ実行までの間に10秒の待機を挟みましたが、The client connection borrowed the database connection [dbConnection=...] for the next query/transaction.
のログとThe database connection [dbConnection=...] borrowed from the connection pool is being released to the connection pool.
のログまでの間にほぼタイムラグがありません。nameを指定したクエリであっても、クエリ実行完了後に即RDS Proxyにコネクションを返却していることが分かります。
ここで気になるのが、複数のクライアントをまたいでname:testのクエリが共有されることにならないのか?という点です。クライアント側としては接続先がRDSなのかRDS Proxyなのか?他のクライアントと接続が共有されていないのか?といったことは意識しないため、自身が新たに実行しようとしているname:testのクエリが実はサーバー側では既に別の定義で存在するといったことが起こりえるはずです。こういった問題を回避するための防御壁としてピン留めという事象が存在するはずなのですが、今回のアップデートによって拡張クエリプロトコルを利用した場合でもピン留めが発生しないようになりました。本当に大丈夫なのでしょうか?
改めて先程までのRDSのログを良く分析してみると、parse test
の前に以下の様なログが出力されており、DEALLOCATE ALL
2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.025 ms parse <unnamed>: DEALLOCATE ALL 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.008 ms bind <unnamed>: DEALLOCATE ALL 2023-11-11 03:43:37 UTC:[4548]:LOG: execute <unnamed>: DEALLOCATE ALL 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.015 ms 2023-11-11 03:43:37 UTC:[4548]:LOG: duration: 0.064 ms parse test:
このことから考えると、RDS Proxyは拡張クエリプロトコルのメッセージをRDSにプロキシする際、DEALLOCATE ALL
を自動で挿入していると推測できます。自動でDEALLOCATE ALL
が発行されるのであれば、nameが指定されたクエリも毎回破棄されるため、複数のクライアント間で同じnameのクエリが共有されるようなことにはなりません。RDS ProxyがDEALLOCATE ALL
2023-11-11 04:18:12 UTC:[4548]:LOG: duration: 0.031 ms parse <unnamed>: DEALLOCATE ALL 2023-11-11 04:18:12 UTC:[4548]:LOG: duration: 0.007 ms bind <unnamed>: DEALLOCATE ALL 2023-11-11 04:18:12 UTC:[4548]:LOG: execute <unnamed>: DEALLOCATE ALL 2023-11-11 04:18:12 UTC:[4548]:LOG: duration: 0.017 ms 2023-11-11 04:18:12 UTC:[4548]:LOG: duration: 0.060 ms parse test: SELECT user = $1 2023-11-11 04:18:12 UTC:[4548]:LOG: duration: 0.042 ms bind test: SELECT user = $1 2023-11-11 04:18:12 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 04:18:12 UTC:[4548]:LOG: execute test: SELECT user = $1 2023-11-11 04:18:12 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 04:18:12 UTC:[4548]:LOG: duration: 0.036 ms ...略 2023-11-11 04:18:22 UTC:[4548]:LOG: duration: 0.024 ms parse <unnamed>: DEALLOCATE ALL 2023-11-11 04:18:22 UTC:[4548]:LOG: duration: 0.009 ms bind <unnamed>: DEALLOCATE ALL 2023-11-11 04:18:22 UTC:[4548]:LOG: execute <unnamed>: DEALLOCATE ALL 2023-11-11 04:18:22 UTC:[4548]:LOG: duration: 0.019 ms 2023-11-11 04:18:22 UTC:[4548]:LOG: duration: 0.066 ms parse test: SELECT user = $1 2023-11-11 04:18:22 UTC:[4548]:LOG: duration: 0.041 ms bind test: SELECT user = $1 2023-11-11 04:18:22 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 04:18:22 UTC:[4548]:LOG: execute test: SELECT user = $1 2023-11-11 04:18:22 UTC:[4548]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 04:18:22 UTC:[4548]:LOG: duration: 0.021 ms
注目したいのが、parse test:
クライアントからは1回しかparseのメッセージを送信していないのに、なぜRDSのログにはparseのログが2回出力されているのでしょうか?先程の検証用プログラムを修正し、RDS Proxyを経由せずに直接RDSにクエリを発行するようにします。
const client = new pg.Client({ host: '<ここをRDSのエンドポイントに変更>', database: 'postgres', user: 'postgres', password: '<パスワード>', })
2023-11-11 05:16:41 UTC:[8420]:LOG: duration: 0.225 ms parse test: SELECT user = $1 2023-11-11 05:16:41 UTC:[8420]:LOG: duration: 0.104 ms bind test: SELECT user = $1 2023-11-11 05:16:41 UTC:[8420]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 05:16:41 UTC:[8420]:LOG: execute test: SELECT user = $1 2023-11-11 05:16:41 UTC:[8420]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 05:16:41 UTC:[8420]:LOG: duration: 0.099 ms ...略 2023-11-11 05:16:51 UTC:[8420]:LOG: duration: 0.071 ms bind test: SELECT user = $1 2023-11-11 05:16:51 UTC:[8420]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 05:16:51 UTC:[8420]:LOG: execute test: SELECT user = $1 2023-11-11 05:16:51 UTC:[8420]:DETAIL: parameters: $1 = 'postgres' 2023-11-11 05:16:51 UTC:[8420]:LOG: duration: 0.017 ms
今度はparseが1回しか出力されていません。ということは2回目のparseはRDS Proxy側が差し込んだメッセージと考えられそうです。
ここまでの結果から考えるとRDS Proxyの裏側では以下のような処理が動いていると推測されます
- 拡張クエリプロトコルによるクエリ発行時に、クライアントが指定したクエリを発行する前に
を発行する - クライアントがname付きのクエリを再利用しようとした時、対象のクエリに関するparseのメッセージを差し込む
- クライアントからのメッセージをそのままプロキシすると、対象クエリが既にDEALLOCATEされていて後続処理に失敗するため
- クライアントからparseのメッセージが送信された際に、各接続ごとにnameをキーにしたSQLをキャッシュして再利用に備えていると思われる
RDS Proxyのアップデートについてご紹介しました。今回のアップデートによって、これまでピン留めが発生していたワークロードでもピン留めが発生しなくなりRDS Proxyが有効活用できることが期待されます。
ピン留めを回避しようとするとORMが使えなくなるといった課題からRDS & RDS Proxyの利用を諦めていたケースにおいてもアーキテクチャ選定の幅が広がったので、是非抑えておきたいアップデートと言えるでしょう。また、ピン留め対策として低レベルな実装を強いられていたようなケースでもORMを有効活用した高レベルな実装が利用できるようになります。低レベルな実装を利用されている場合は、実装の修正も検討してみてください。
Be careful not to fall into the trap of premature optimization. Most of your queries will likely not benefit much, if at all, from using prepared statements. This is a somewhat "power user" feature of PostgreSQL that is best used when you know how to use it - namely with very complex queries with lots of joins and advanced operations like union and switch statements. I rarely use this feature in my own apps unless writing complex aggregate queries for reports and I know the reports are going to be executed very frequently.