Tableau Desktopからデータへの接続方法、ライブと抽出 ー Tableau Desktop再入門
こんにちは、スズです。
Tableau Desktop再入門シリーズ、今回はTableau Desktopからデータに接続する2つの方法、ライブと抽出についてご紹介します。
執筆環境
本記事は以下の環境で執筆しています。
- Tableau Desktop 2022.2
- Windows 10 Pro
ライブと抽出
ライブは、Tableau Desktopからデータベースなどのデータソースに直接接続する方法です。グラフの作成などの何らかの処理を行う際にデータソースからデータを取得する方法となります。抽出は、データソースからデータを抽出し、ローカルに圧縮スナップショットを保存、保存したファイルに接続する方法となります。
ライブと抽出は、[データソース]タブの右上の[接続]から切り替えることができます。
抽出の作成
抽出の作成方法
抽出はTableau Desktopからデータにライブで接続したのち作成することができます。データに接続したのち、[データソース]タブの右上の[接続]を[抽出]に切り替え、[編集]をクリックすると、[データの抽出]ウィンドウが表示されます。
[データの抽出]ウィンドウで抽出にデータを保管する方法を指定し、[OK]をクリックします。[シート]タブをクリックすると、抽出したデータを保存する.hyperファイルの保存場所の指定画面が表示されます。
データの抽出が完了すると、指定の場所にファイルが保存されています。
Tableau Desktopの[データソース]タブを表示すると、抽出を行った日時が表示されています。
抽出したデータを参照している場合、[接続]欄には[更新]が表示されます。データソース側でデータの更新があった際、抽出したデータに最新のデータを反映させたい場合は[更新]をクリックして対応できます。
抽出の設定
データストレージ
データの保存方法として、論理テーブルまたは物理テーブルを選択できます。
単一のテーブルを使用する場合、データの保存方法として論理テーブルのみ選択できます。論理テーブルでは、データソースの1つの論理テーブルに対して、抽出データでは1つのテーブルに格納します。データソースに3つの論理テーブルがある場合は、抽出データでは3つのテーブルに格納します。
物理テーブルの場合、データソースの複数のテーブルに対して、抽出データでは1つのテーブルに格納します。物理テーブルを選択するには、以下の条件を満たす必要があります。
- 物理テーブルの結合がすべて等価 (=) 結合である
- リレーションシップまたは結合に使用される列のデータ型が同一である
- パススルー関数 (RAWSQL) が使用されていない
- 増分更新が構成されていない
- 抽出フィルターが構成されていない
- 上位Nやサンプリングが構成されていない
フィルター
フィールドと値を選択することで、その条件に合致したレコードのみ抽出します。
集計
[表示されているディメンションでデータを集計]を有効にすると、メジャーを集計した状態で抽出します。
以下のサンプルデータで[表示されているディメンションでデータを集計]の動作をご紹介します。
[表示されているディメンションでデータを集計]を有効にし、抽出ファイルを作成します。抽出したファイルをTableau Desktopで表示してみると、以下のようなデータが表示されました。日付と種類のフィールドの値が同じ場合に売り上げの値が集計されています。
[表示されているディメンションでデータを集計]では[次の単位で日付をロールアップ]のオプションがあり、日付によってロールアップすることもできます。
先程のデータを[次の単位で日付をロールアップ]で[年]を指定し、再度抽出ファイルを作成します。抽出したファイルをTableau Desktopで表示してみると、以下のように、全て2022年でまとめられたデータが表示されました。
※上記の動作の紹介では、抽出したデータを確認するために直接抽出ファイルをTableau Desktopで表示しておりますが、抽出に直接接続することは推奨されておりませんのでご注意ください。
参考:データの抽出 - Tableau
行数
すべての行を抽出するか、行数を指定して抽出するかを選択できます。行数を指定する場合、上からの行数を指定するか、またはサンプルでの行数を指定することができます。
未使用のフィールドをすべて非表示
[データソース]タブで非表示にしたフィールドや、[シート]タブで未使用のフィールドを抽出から除外します。
最後に
Tableau Desktopでのデータへの接続方法としてライブと抽出についてご紹介しました。