CS アナリティクスでは BigQuery のテーブルや UDF などの情報も一覧表示で確認できます

2021.02.12

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、みかみです。

弊社クラスメソッドの自社プロダクト CS アナリティクス(以下 CSA )は、短期間、低コストで導入可能な統合データ分析基盤です。

概要

データロードやマート作成などのジョブを作成・実行・管理できる CSA ですが、テーブルやビュー、UDF などの情報も画面から確認できます。

本エントリでは、CSA の DWH に BigQuery を選択した場合に、どの画面でどんな BigQuery 関連情報が確認できるかご紹介したいと思います。

CSA JMCの挙動確認バージョン

当エントリの内容は以下のCSA JMCバージョンで挙動を確認しています。

  • CSA JMC v5.5.0

前提

CSA のサイト設定手順は省略します。詳細は以下のエントリをご参照ください。

リソース情報を確認

画面上部の「リソース」メニューから「リソース管理情報」をクリックすると、リソース管理情報画面に遷移します。

リソース管理情報画面下部「BigQuery メタ情報」欄の「テーブル一覧(件数・容量情報)」リンクから BigQuery のテーブルやビューの情報を、「UDF・ストアド一覧」リンクからユーザー定義関数やプロシージャの情報を確認することができます。

なお、「エンドポイント・接続情報」に表示されている「Amazon RDS接続情報」は CSA が動作するために使用する管理データベースの接続情報で、変更することはできません。

「Google Cloud Storageのバケット情報」と「BigQuery 接続情報」は、「サイト設定」から「DWH接続設定」画面で設定・変更可能です。

テーブル一覧・詳細を確認

テーブル一覧画面では、BigQuery のテーブル、ビューの一覧が確認できます。

サイト設定の「BigQueryプロジェクトID」で指定したプロジェクトの全てのデータセット配下のテーブルとビューが一覧表示されます。

「テーブル種別」欄には、作成済みのテーブル・ビューの種別に従って、以下のいずれかか表示されます。

  • TABLE:BigQuery にデータを格納済みのネイティブテーブル
  • EXTERNAL:GCS や BigTable などの BigQuery 以外の場所にデータを保持している外部テーブル
  • VIEW:CREATE VIEW 構文によって他テーブルデータを参照しているビュー
  • MATERIALIZED_VIEW: CREATE MATERIALIZED VIEW 構文によって他テーブルデータを参照している実体化ビュー

テーブル種別が EXTERNAL または VIEW の場合、テーブル/ビューデータの「行数」と「容量」は表示されません。 後述のテーブル詳細画面でもサンプルデータが表示されません。 BigQuery では SELECT 文を実行すると処理したデータ量に従って課金が発生します。 外部テーブルやビューの場合、通常のネイティブテーブルとは異なり、データ量やサンプルデータは SELECT 文で取得する必要があるので、クエリ課金が発生するのを防ぐためです。

GCP の BigQuery 管理画面でもテーブルやビューの一覧は確認できますが、CSA の画面からなら各テーブルのデータ量や有効期限などもまとめて確認することができます。

テーブル名のリンクをクリックすると、テーブルの詳細情報が確認できます。

「テーブル定義」欄では、データセット名、テーブル名とテーブルのカラムの情報を確認できます。 下の「テーブルスキーマ」タブをクリックすると、テーブルスキーマの JSON 定義が表示されます。

この JSON 定義は、BigQuery 管理画面や bq コマンドでテーブルを作成する場合に指定できます。

画面下半分の「データ情報」欄では、テーブルに格納されているデータのレコード件数と容量、テーブルのサンプルデータを確認できます。 なお、画像のサンプルデータはデータ確認用に作成した架空データで、実在の人物とは一切関係ありません。

テーブル定義、データ容量、サンプルデータなどを、1画面でまとめて確認できて便利です。

UDF・ストアド一覧を確認

リソース管理情報画面一番下のリンクをクリックすると、UDF・ストアド一覧画面に遷移します。

一覧では、データセット名とユーザー定義関数名またはプロシージャ名と定義内容を確認できます。

どのデータセットに、どんな処理をする関数やプロシージャがあるのか一目でわかるので、SQL を作成する場合の確認などに役立つかと思います。

まとめ

本エントリでは CSA 画面からリソース情報を確認する方法についてご紹介しましたが、CSA ではデータロードや SQL をジョブとして登録し、簡単に実行・管理することができます。 画面からの UI 操作でジョブのスケジュール実行設定やエラー通知の設定、実行ログの確認なども可能です。

DWH は BigQuery の他に、Redshift と Snowflake にも対応しており、もちろんどの DWH でもテーブルや UDF などの情報を CSA 画面からご確認いただけます。

BigQuery のテーブルや UDF などの情報も確認できる統合データ分析基盤 CSA について、少しでもご興味をお持ちいただけましたら、ぜひお気軽に弊社クラスメソッドにご連絡ください!