Tableau Desktopからデータへの接続とデータインタープリター ー Tableau Desktop再入門

2022.07.27

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、スズです。

Tableau Desktopは、ドラッグ&ドロップで操作可能なインターフェースでデータの可視化が行えるセルフサービス分析ツールです。

Tableau Desktopの基本的な使い方や機能を改めて紹介していくTableau Desktop再入門シリーズとして、細々と書いていきたいと思います。第一回の本記事では、Tableau Desktopからデータへの接続とデータインタープリターについてご紹介します。

執筆環境

本記事は以下の環境で執筆しています。

  • Tableau Desktop 2022.2
  • Windows 10 Pro

データへの接続

Tableau Desktopでデータを可視化するために、まずは可視化したいデータに接続します。Tableau Desktopを起動すると、左ペインに[接続]が表示されます。この[接続]からデータに接続します。

接続先は以下の中から選択できます。

  • データの検索
  • ファイルへ
  • サーバーへ
  • 保存されたデータソース

データの検索

Tableau ServerまたはTableau Cloudにアクセスし、アクセス先にあるデータソースやテーブルなどから選択してデータに接続します。

ファイル

Excel、CSV、PDFなどのファイルに接続します。

サーバー

Amazon RedshiftやGoogle BigQueryなどのデータウェアハウスや、Box、Salesforceなどに接続できます。[サーバーへ]にある[その他]をクリックすると、接続可能なコネクタの一覧が表示されます。

保存されたデータソース

保存されたデータソースの中から選択して簡単にデータにアクセスできます。初期状態ではTableauが用意しているサンプルデータが表示されています。

保存されたデータソースへの追加

ダッシュボードを作成していく中で頻繁に利用するデータなどがある場合、簡単にアクセスできるように保存されたデータソースに追加することができます。

シートから[データ]ペインにあるデータソースの名前を右クリックし、[保存されたデータソースに追加]からデータソースファイル(.tds)またはパッケージドデータソース(.tdsx)で[マイTableauリポジトリ]配下の[データソース]に保存することで、保存されたデータソースに追加できます。

データインタープリター

Excel、CSV、PDF、Googleスプレッドシートに接続した場合、[データインタープリターの使用]というオプションが表示されることがあります。

データインタープリターは、接続したデータがTableauで解釈できない形式になっていた場合に、Tableauで分析しやすい形式に自動で調整する機能です。Tableauで読み込んだデータの調整を行いますが、接続元のデータには影響ははありません。

ここでは、e-Statの以下のファイルを使ってデータインタープリターを試してみます。

Excelでファイルを開くと以下のようになっています。最初の数行は使用したいデータではなかったり、ヘッダーが複数重なっていたり、このまま使用するのは難しそうですね。

こちらのファイルをTableau Desktopで接続し、データインタープリターを試してみます。

コードの列が数値と認識されているため「a」の値がNullになっていますが、パッと見たところこのままデータを利用することもできそうです。(ちなみに、コードの列を手動で文字列に変更すると「a」の値も表示されました。)

データインタープリターを使用すると結果のレビューを参照できます。結果のレビューでは元のデータに対してTableauがどう解釈したのかを確認できます。以下の画像では、ピンクの部分は列のヘッダー(フィールド名)、緑の部分は値として解釈されています。どの色が何を示しているのかなども結果のレビューの中に解説があります。

Tableauで解釈しやすい形式に自動調整するデータインタープリターですが、以下の条件に合致するデータの場合は使用することはできません。

  • データに 2000 を超える列が含まれている。
  • データに 3000 を超える行と 150 を超える列が含まれている。

最後に

Tableau Desktopからデータへの接続とデータインタープリターについてご紹介しました。

関連ヘルプ