Provisioned Redshift クラスターのノードタイプとノード数をワークロードに合わて選択する方法を教えてください
困っていた内容
プロビジョニングされた Redshift クラスターを利用する予定なのですが、ワークロードに合わせたノードタイプとノード数を見積もる方法はありますか? あまりオーバースペックにはしたく無いので、ある程度の基準が分かると助かります。
結論
マネジメントコンソール上で Provisioned Redshift クラスターを作成する際に、「クラスターのサイズを選択する」の項目で「選択のヘルプ」をご利用ください。
クラスターのサイズがわからない場合は、[Help me choose (選択ヘルプ)] を選んでください。これにより、データウェアハウスに保存する予定のデータのサイズとクエリの特性について質問するサイジング計算ツールが起動されます。
やってみた
1. マネジメントコンソール上で、サービス Amazon Redshift を選択した後に、画面左ペインで「プロビジョニングされたクラスターダッシュボード」を選択します。
2. 「クラスターを作成」ボタンを押下します。
3. 「選択のヘルプ」を選択します。
4. ワークロードで必要なストレージサイズやクエリされるデータ範囲を、以下のように指定してみます。
・必要な推定ストレージ量を 120 GB
・保存する予定のデータの月数を 12 カ月分
・一般的なワークロードでは 3 カ月分のデータに対してクエリが実行される
5. 指定した条件においては、ノードタイプ dc2.large ノード数 1 がオススメと表示されました。
6. 想定されるワークロードを以下のように変更してみます。
・必要な推定ストレージ量を 30 TB
・保存する予定のデータの月数を 36 カ月分
・一般的なワークロードでは 12 カ月分のデータに対してクエリが実行される
7. 今度は、ノードタイプ ra3.4xlarge ノード数 2 がオススメと表示されました。指定したワークロードによってノードタイプとノード数が変わることが確認できました。
時間ディメンションが無いデータや、圧縮されたデータを元に見積もりすることも可能なようです。
他にもいろいろ試してみてください。
まとめ
本機能を知った時は、こんな機能があったのかと驚いてしまいました。毎日のようにマネジメントコンソールを触っていても、まだ知らない便利な機能はたくさんあると思うので、見つけた時はどんどんシェアしていきたいと思います。
この記事がどなたかのお役に立てば幸いです。