フィールドとチャートのタイプ〜生成されたフィールドについて理解する #tableau

2018.04.09

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

お早うございます。大阪オフィス唯一のDI部メンバー、tamaでございます。

本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。

本エントリの概要

今回は「生成されたフィールドについて理解する」ということで、今一度原点(?)に帰る感じで、Tableauで必ず見ることになるフィールドについて見ていきたいと思います。

※今回の内容は、「連続と不連続」について、ある程度理解しておく必要があります。連続と不連続についてのエントリはこちらからどうぞ。

そもそも「フィールド」とは?

Tableauはマニュアルを熟読しなくても、ある程度個人の感覚のみで操作できてしまう部分があるので、いちいちTableauのどの部分が何という名称なのか把握していないユーザーもいると思います。

で、実際のところフィールドって何よ?って話なのですが、下記画像をご覧ください。

上記の赤枠で囲っているものがフィールドとなります。要するにTableauでいつも操作している「データの項目」ですね。これを(データ)フィールドと呼称します。

もう少し具体的に…

Tableauからデータソースに接続したとき、下記のような画面が表示されると思います。(データソース画面)

この画像の赤枠で囲っているところは、データのカラム(列)ですが、このカラムそれぞれがフィールドとして生成されます。生成されると同時に、そのカラムのデータ型(数値型とか文字列型とか)や役割(不連続or連続、メジャーorディメンション)が自動的に設定されます。

2つのフィールドの種類

メジャー

メジャーとは、基本的に数値とか量を表すデータを指します。分かりやすく言うと、何らかの集計(合計、平均など)を行うことができるデータがメジャーとなります。

ディメンション

ディメンションとは、文字列や定性的な数値を表すデータを指します。メジャーの逆…という言い方は正確ではないかもしれませんが、集計できないデータと考えると分かりやすいかもしれません。基本的には文字列データであることが多いですが、数値の場合もあります(顧客IDなど)。

ディメンションの主な役割としては、メジャーを分割することです。売上や利益といったメジャーに、ディメンションを加えることで、「地域別の平均売上」「顧客区分別利益」といったビューを可視化することができます。

青色と緑色の違い

ここまで見てみると、「ああ、緑色のフィールドがメジャーで、青色のフィールドがディメンションなんだな」と思いがちですが、実はそうではありません。フィールドにはもう一つの役割が付与されています。それは下記の通りです。

  • 緑色:連続
  • 青色:不連続

※連続と不連続についてはこちらのエントリもご覧ください。

上記のような誤解をしがちなのは、メジャーとディメンションの特性上、メジャーは連続に、ディメンションは不連続になりがちだからです。「なりがち」というだけであって、逆もあり得ます。

連続フィールド

「連続」フィールドをビューにドラッグすると、以下のようになります。

 「連続」フィールドを行及び列に配置すると、「軸」が表示されます。ここでいう軸とは、その連続したデータの最小値から最大値までを表す指標のようなものです(現実世界でいう定規みたいな感じ)。

ちなみに、軸はフィールド毎に作成されます。ですので、列に連続フィールドを2つ配置すると以下のようになります。

列と行に複数配置すると、以下のようになります。(自動的に散布図になります)

不連続フィールド

「不連続」フィールドをビューにドラッグすると、以下のようになります。

「不連続」フィールドを行及び列に配置すると、「ヘッダー」が表示されます。ヘッダーは基本的にそのままの意味で、連なっていない不連続のデータ毎に列が表示される…という感じです。

列と行に複数配置すると、以下のようになります。

配置した不連続フィールドに応じて、ヘッダーが入れ子になります。

フィールドについて把握しておくと便利

ここまで、フィールドの役割による可視化の違いについて見てきましたが、これらを抑えておくと、Tableauで色々なVizを作成するにあたり、作業をよりスムーズに運ぶことができます。

例えば、Excelのような、テキストのみのクロス集計表が作成したい場合、まずはボンヤリとクロス集計表を思い浮かべてみます。すると、必要なのは「ヘッダー」だけであって、「軸」はいらないことがわかります。ここまでわかれば、「不連続フィールドを行列に配置すればいい」というところまで分かるので、後はそれに沿って作業をすれば、すぐにビューは作成されるでしょう。

また、散布図の場合は、「縦と横にそれぞれ軸が必要」ということがわかるので、列と行にそれぞれ連続フィールドが必要…という風に作業レベルに変換することができます。

フィールドの役割について把握しておくと、Tableauで行う作業が、より分かりやすくなります。

おわりに

今回はフィールドについて見てきました。列や行だけでなく、フィルターやマークシェルフに配置する時も、フィールドの役割によって動作が変わってきますので、色々試してみて下さい。

参考