データ接続〜シャドー抽出について理解する #tableau
はじめに
お早うございます。大阪オフィス唯一のDI部メンバー、tamaでございます。
本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。
本エントリの概要
今回は「シャドー抽出」について見てきます。先に言っておくと、Tableau Desktopを使用するにあたって、全く実用性は無い知識となります。(実際に試験にシャドー抽出に関する問題が出た、という情報も聞いたことがありません…)かつ小ネタ級のエントリです。
しかし、試験ガイドにしっかりと記載されており、名前がなんかかっこいいのでご紹介します。
シャドー抽出とは
一言で説明すると、Tableau Desktopが自動で作成する一時ファイルです。Tableau DesktopでExcelやテキストファイル(csv)、統計ファイルを読み込んだ時に作成されます。
作成される場所は、以下の通りです。
- Windows の場合
Users\AppData\Local\Tableau\Caching\TemporaryExtracts
- Mac の場合
~Library/Caches/com.tableau.Caching/TemporaryExtracts
シャドー抽出の拡張子は、10.5以降が「.hhyper」、10.4以前は「.ttde」です。最大5つまで保持されます。6つ目が作成されると同時に、一番古いものが削除されます。
シャドー抽出が作成される理由
Excel等にライブ接続している時の、Tableau Desktopのデータ読込速度を高速化するためです。
過去バージョンのTabelauはMicrosoft Jetドライバーを用いて、Excelファイルやテキストファイルへクエリをかける仕組みでしたが、これは他OSへの移植性が弱い等、いくつか欠点がありました。また、全てのクエリに対してファイル解析を実行する必要があったため、そもそも遅いという課題もありました。
そこで、一時的な抽出ファイルを作成しておき、クエリはそこに発行することで、前述の欠点を解消することができました。
ちなみに、抽出ファイルといっても、正規で作成した抽出ファイルとは構造が異なるため、シャドー抽出を抽出ファイルみたいに扱う(接続する等)ことはできません。
まとめると
- シャドー抽出はTableau Desktopが自動的に作成する一時ファイル
- これのおかげでExcelファイル等へ接続した時のTabelauのスピード品質が保たれている
- ユーザーが能動的に利用するファイルではない
- Tabelauを使用する上で、特に意識する必要はありません。
- PCの容量を削減したい時は、シャドー抽出を削除するのもアリ
おわりに
今回はシャドー抽出について見てきました。結局、ユーザーが意識する必要はないもの…という結論になってしまいましたが、もしかすると試験に出題されるかもしれないので、ゴマ塩程度に覚えておくといいかもしれません。