Amazon Redshift 管理ガイド – Amazon Redshiftとは何か?

2013.08.12

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

redshift-management-guide

DB開発者ガイドと合わせて、『管理ガイド』(Management Guide)の方も攻めて行こうと思います。同様にTOPのページから。こちらのドキュメントでは管理の側面から、どういう事が出来るのか、どういう手段(GUI、SDK等)で出来るのか、と言った観点から解説を行なっています。

Amazon Redshiftとは何か?

Amazon Redshiftクラスタ管理ガイドへようこそ。Amazon Redshiftは、クラウド内で完全に管理された、ペタバイト規模のデータウェアハウスサービスです。

あなたが普段使っているものと同じ、SQLベースのツールやビジネス・インテリジェンス(BI)アプリケーションを使って、Amazon Redshiftは事実上、どんなサイズのデータ分析であっても高速なクエリパフォーマンスを提供します。AWS管理コンソールで数回クリックするだけで、あなたは数百ギガバイトのデータから始めて、ペタバイト以上のデータにスケールするAmazon Redshiftクラスタを起動する事が出来ます。

データウェアハウスを作成するための最初のステップは、Amazon Redshiftクラスタと呼ばれる計算ノードのセットを起動する事です。必要となる計算ノードの数とタイプは、データのサイズやクエリ実行のパフォーマンスによってによって異なります。プロビジョニングしたそれぞれのクラスタはAmazon Redshiftデータウェアハウスによって完全に管理されます。あなたはAmazon Redshift管理コンソールやAPI、CLIを使い、クラスタの作成や管理を行う事が出来ます。

デフォルトでは、クラスタ作成時のデータベース作成数は1つです。必要に応じて、データベースを追加する事が出来ます。クラスタがプロビジョニングされた後は、あなたが既に使い慣れているSQLベースのツールやBIアプリケーションを用いてデータ分析やクエリの実行、データセットのアップロード等を行う事が出来ます。データセットのサイズに関係無く、Amazon Redshiftは高いクエリパフォーマンスを提供しています。

Amazon Redshiftは設定・操作・データウェアハウスをスケーリングする全ての作業:容量のプロビジョニング、監視及びクラスタのバックアップ、Amazon Redshiftエンジンへのパッチやアップグレードを適用、等を管理します。ビジネス・顧客のための新たな洞察を獲得する為のデータを利用に焦点を当てる事が出来るのです。

クラスタ管理概要

クラスタ管理は以下の操作を含みます。

クラスタの作成と管理

データウェアハウスのニーズに応じて、シングルXLノードの小さなクラスタで始める事が出来、また要件の変化に応じて簡単に100 8XLノードにスケールアップする事が出来ます。データウェアハウスのパフォーマンスを監視する事が出来、必要に応じてサービスを中断する事無くノードを追加したり、削除する事が出来ます。詳細はAmazon Redshift Clustersをご参照ください。

もし、クラスタを1年またはそれ以上実行し続ける事を考えている場合、1年間または3年間の計算ノードを予約する事によって利用料金を節約する事が出来ます。計算ノードを予約すると、規定により、オンデマンドでノード計算をした際に支払う料金に比べて大幅なコスト削減が見込めます。詳細については、Purchasing Amazon Redshift Reserved Nodesをご参照ください。

クラスタセキュリティグループの作成と管理

デフォルトでは、作成したクラスタは(利用者)全員に対して閉じられた形となっています。クラスタへのアクセスを有効にするには、セキュリティグループを作成しクラスタに関連付けます。

あなたが実行しようとしているSQLクライアントがEC2インスタンス上で実行されている場合、明示的なインバウンドアクセスをCIDR/IPアドレスの特定の範囲に、またはAmazon EC2セキュリティグループに付与する為にルールをセキュリティグループに追加します。

詳細については、Amazon Redshift Cluster Security Groupsをご参照ください。

パラメータグループの作成と管理

Amazon Redshiftのクラスタを作成する際、クラスタにパラメータグループを関連付けます。グループにおけるパラメータ(例:日付表示のスタイルや浮動少数点精度など)は、クラスタ上で作成された全てのデータベースに適用されます。パラメータ設定値を定義しているAmazon Redshiftエンジンにはデフォルトパラメータグループが存在します。

アプリケーションが異なる設定を必要とする場合は、独自のパラメータグループを作成する事が出来ます。詳細については、Amazon Redshift Parameter Groupsをご参照ください。

スナップショットの管理

Amazon Redshiftは、プロジェクトのデータロスを防ぐために、継続的にあなたのデータをAmazon Simple Storage Service(S3)のバケットにバックアップします。また、あなたのクラスタの独自のポイント-イン-タイム バックアップを作成するオプションがあります。これらの自動及び手動バックアップはスナップショットと呼ばれています。

スナップショットを取った時には、その状態にクラスタを復元する事が出来ます。Amazon Redshiftは、自動と手動のスナップショットをサポートしています。詳細については、Amazon Redshift Snapshotsをご参照ください。

クラスタパフォーマンスのモニタリング

Amazno Redshiftは、クラスタ及びクエリの健康状態(health)、クラスタやクエリのパフォーマンスを追跡出来るようなメトリクス情報を収集します。1つ以上のメトリックが許容範囲外にある時に通知するアラームを設定する事も出来ます。最も一般的なクラスタのパフォーマンスメトリックにアクセスしたり、個々のクエリのリソース使用率を確認する為に、Amazon Redshift管理コンソールを使う事も出来ます。

また、CloudWatchを使用してクラスタのパフォーマンス・メトリックを表示する事が出来ます。詳細については、Amazon Redshift Cluster Performanceを御覧ください。

Amazon Redshiftリソースへのアクセスコントロール

クラスタを作成するAWSアカウントは、クラスタに対する完全なアクセス権を持っています。AWSアカウント内では、ユーザーアカウントを作成し、それらアカウントのアクセス許可を管理するためにAWSのID及びアクセス管理(AWS Identify and Access Management:IAM)サービスを使う事が出来ます。

IAMを使用する事により。あなたは別のユーザーに対し、自分の仕事に必要な唯一のクラスタ操作を実行する権限を付与する事が出来ます。IAMはAmazon RedshiftのAPIアクセスを制御します。JDBC経由やODBC経由でクラスタへのアクセスを制御するというような事はありません。

詳細については、Controlling Access to Amazon Redshift Resourcesをご参照ください。

『Amazon Redshift 管理ガイド』その他のエントリ

当ドキュメントに関するその他のエントリについても、出来たものについては随時こちらにリンクを貼って行こうと思います。

参考情報