Provisioned Redshift クラスターのノードタイプとノード数をワークロードに合わて選択する方法を教えてください

2023.05.15

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

困っていた内容

プロビジョニングされた Redshift クラスターを利用する予定なのですが、ワークロードに合わせたノードタイプとノード数を見積もる方法はありますか? あまりオーバースペックにはしたく無いので、ある程度の基準が分かると助かります。

結論

マネジメントコンソール上で Provisioned Redshift クラスターを作成する際に、「クラスターのサイズを選択する」の項目で「選択のヘルプ」をご利用ください。

クラスターの作成

クラスターのサイズがわからない場合は、[Help me choose (選択ヘルプ)] を選んでください。これにより、データウェアハウスに保存する予定のデータのサイズとクエリの特性について質問するサイジング計算ツールが起動されます。

やってみた

1. マネジメントコンソール上で、サービス Amazon Redshift を選択した後に、画面左ペインで「プロビジョニングされたクラスターダッシュボード」を選択します。

2. 「クラスターを作成」ボタンを押下します。

3. 「選択のヘルプ」を選択します。

4. ワークロードで必要なストレージサイズやクエリされるデータ範囲を、以下のように指定してみます。
・必要な推定ストレージ量を 120 GB
・保存する予定のデータの月数を 12 カ月分
・一般的なワークロードでは 3 カ月分のデータに対してクエリが実行される

5. 指定した条件においては、ノードタイプ dc2.large ノード数 1 がオススメと表示されました。

6. 想定されるワークロードを以下のように変更してみます。
・必要な推定ストレージ量を 30 TB
・保存する予定のデータの月数を 36 カ月分
・一般的なワークロードでは 12 カ月分のデータに対してクエリが実行される

7. 今度は、ノードタイプ ra3.4xlarge ノード数 2 がオススメと表示されました。指定したワークロードによってノードタイプとノード数が変わることが確認できました。

時間ディメンションが無いデータや、圧縮されたデータを元に見積もりすることも可能なようです。
他にもいろいろ試してみてください。

まとめ

本機能を知った時は、こんな機能があったのかと驚いてしまいました。毎日のようにマネジメントコンソールを触っていても、まだ知らない便利な機能はたくさんあると思うので、見つけた時はどんどんシェアしていきたいと思います。

この記事がどなたかのお役に立てば幸いです。

参考資料