Amazon Redshift Loads ビューでデータのロードを管理する

2015.07.29

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Redshiftでは初期導入のデータの移行の他にも、定期的に外部のシステムからデータのロードが行われます。このデータの流れを把握したり、管理するのが、本日ご紹介する Loads ビューとなります。

Loads ビューにできること

Loads ビューは、過去24時間(デフォルト)に実行されたデータのロードが表示されます。Loads ビューの各行が一つのロードに相当し、最も新しく実行したロードが一番上の行に表示されます。Loadの番号を選択するとロードの詳細が表示されます。

  1. ロードの参照
  2. 実行したSQLの参照
  3. 実行中のロードの停止

1.ロードの参照

データのロードについては、以下の様に表示されます。CREDENTIALSの値を除いたCOPY文が表示されます。 redshift-loads-view

2.実行したSQLの参照

 

Loads Detailsの表示するには、Loads ビューのクエリのID(や虫眼鏡マーク)をクリックします。

redshift-loads-view-pickup

また、もう一つの方法は、Performance ビューからクエリのIDをクリックでも開けます。

redshift-performance-view-load-pickup

Load Execution Details セクションが展開されると、そのクエリの実行したSQL、Plan、Actual、メトリックス等の詳細画面が表示します。

redshift-loads-view-execution-details

3.実行中のロードの停止

Loads ビューから 実行中のクエリを開き、[Terminate Load] を押すとロードを停止できます。コンソールへのログインやSQLコマンドの実行が不要なのは便利ですね。

redshift-loads-view-load-terminate

強制終了したクエリは、ロールバックされます。

まとめ

Redshiftではデータの入力は Load ビューに集約し、それ以外はクエリーと位置づけ、Queries ビューで管理します。この2つのビューの画面構成はほぼ同じで、Queriesビューに慣れている方であれば違和感は無いでしょう。

関連記事として、以下のブログがございますので合わせてお読みいただけると問題解決の手法や理解が深まるのではないかと思われます。

Amazon Redshift Performanceビューから読み解くアクティビティと監視のポイント

Amazon Redshift Queries ビューで問題のクエリを特定する