データ接続〜シャドー抽出について理解する #tableau

2018.05.08

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

お早うございます。大阪オフィス唯一のDI部メンバー、tamaでございます。

本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。

本エントリの概要

今回は「シャドー抽出」について見てきます。先に言っておくと、Tableau Desktopを使用するにあたって、全く実用性は無い知識となります。(実際に試験にシャドー抽出に関する問題が出た、という情報も聞いたことがありません…)かつ小ネタ級のエントリです。

しかし、試験ガイドにしっかりと記載されており、名前がなんかかっこいいのでご紹介します。

シャドー抽出とは

一言で説明すると、Tableau Desktopが自動で作成する一時ファイルです。Tableau DesktopでExcelやテキストファイル(csv)、統計ファイルを読み込んだ時に作成されます。

作成される場所は、以下の通りです。

  • Windows の場合
    • Users\AppData\Local\Tableau\Caching\TemporaryExtracts
  • Mac の場合
    • ~Library/Caches/com.tableau.Caching/TemporaryExtracts

シャドー抽出の拡張子は、10.5以降が「.hhyper」、10.4以前は「.ttde」です。最大5つまで保持されます。6つ目が作成されると同時に、一番古いものが削除されます。

シャドー抽出が作成される理由

Excel等にライブ接続している時の、Tableau Desktopのデータ読込速度を高速化するためです。

過去バージョンのTabelauはMicrosoft Jetドライバーを用いて、Excelファイルやテキストファイルへクエリをかける仕組みでしたが、これは他OSへの移植性が弱い等、いくつか欠点がありました。また、全てのクエリに対してファイル解析を実行する必要があったため、そもそも遅いという課題もありました。

そこで、一時的な抽出ファイルを作成しておき、クエリはそこに発行することで、前述の欠点を解消することができました。

ちなみに、抽出ファイルといっても、正規で作成した抽出ファイルとは構造が異なるため、シャドー抽出を抽出ファイルみたいに扱う(接続する等)ことはできません。

まとめると

  • シャドー抽出はTableau Desktopが自動的に作成する一時ファイル
  • これのおかげでExcelファイル等へ接続した時のTabelauのスピード品質が保たれている
  • ユーザーが能動的に利用するファイルではない
    • Tabelauを使用する上で、特に意識する必要はありません。
  • PCの容量を削減したい時は、シャドー抽出を削除するのもアリ

おわりに

今回はシャドー抽出について見てきました。結局、ユーザーが意識する必要はないもの…という結論になってしまいましたが、もしかすると試験に出題されるかもしれないので、ゴマ塩程度に覚えておくといいかもしれません。

参考