フィールドとチャートのタイプ〜「連続」「不連続」について理解する #tableau

2018.02.22

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんにちは。DI部のtamaです。

本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。

本エントリの概要

今回は「「連続」と「不連続を理解する」ということで、それぞれの意味と違いについておさらいしたいと思います。

Tabelauを使用する上で、この2つは必ず出てくる概念であり、作成するVizの種類や見た目に大きく影響する要素ですので、Qualified Associateに限らず、理解しておくと良いと思います。

多少Tabelauを使用していると、感覚的にこの2つの違いはつかめてくるのですが、ここは今一度、ブログとしてまとめておきたいと思います。

ちなみに、Tableau Japanの公式ブログ等にも、詳細な解説がありますので、そちらもご覧ください。(本エントリ下記「参考」参照)

概要(Tableau上で連続と不連続がどう表示されているか)

Tableauで扱う項目にはディメンションとメジャーがありますが、これらの項目にはもう一つの種類があり、それが「連続」「不連続」です。
Tabelauのどこを見れば、その項目が連続か不連続か分かるのか…ですが、シンプルに言ってしまうと、以下の通りになります。

  • (項目の色が)青色:不連続
  • (項目の色が)緑色:連続

よく「ディメンションが青で、メジャーが緑色」と思いがちですが、実は連続か不連続かの違いなのです。
なぜこういう風に思いがちになってしまうのかというと、Tabelauがデータソースに接続したとき、デフォルトでディメンション(と認識された項目)は不連続に、メジャー(と認識された項目)は連続に振り分けるからです。

Tableau上での見分け方についてはわかりましたが、では、そもそも連続、不連続とは何なのでしょうか。

不連続とは

不連続の概念

「連続していない値」…言ってしまえば、こういうことなのですが、ピンときませんよね。

例えば「顧客名」、これが不連続と言われたら、これは比較的しっくりくるのではないでしょうか。人の名前が連続するという概念の方がわかりませんからね。田中さんと山田さんの間に、何らかの決まった名前はありません。それぞれの名前(値)は独立しています。

これが「1〜10」の値だったときはどうでしょう。普通は「1,2,3,4,5,6,7,8,9,10」の10個の値がある…と思いますよね。しかし、この値を「不連続」として扱う場合は、考えが異なってきます。

「連続していない」ので、1から10の間にある値が、必ずしも上記通りとは限りません。例えば11が入ってもおかしくありませんし、逆に2や3が無くても問題ない、6と9の順番が逆でも成立します。
「不連続」なので、連続した数字の並びという概念がありません。全ての値は独立しており、その範囲の個々の値のみを取り扱います。

不連続を使用してみる

とはいっても、なかなかわかりにくい概念とは思いますので、実際に見てみましょう。

上記は、サンプルスーパーストアデータを使用して、年別の売上を可視化したVizです。こちらの「年(オーダー日)」という項目に注目してください。青色なので、このオーダー日は「不連続」として扱われています。

不連続として扱われているということは、この「オーダー日(年)」の値はそれぞれ独立しています。日付のデータなので、どうしても1つの流れがあると思ってしまいますが、そこはあくまで不連続。例えば、この2016と2017は別々の値として扱われています。

不連続の項目には以下のような特徴があります。

  • 「ヘッダー」が表示される
    • 不連続を配置すると、ビューには、値がそれぞれ表示されます。例え「1〜10」のような数値であっても、不連続の場合は、その範囲に存在する値がそれぞれヘッダーとして表示されます。
    • 上記の画像の場合、オーダー日の年なので、それぞれの年(2014,2015,2016,2017)が表示されています。
  • 並び替えができる
    • 不連続は「それぞれの値が独立している」ため、並び替えても問題ありません。上記の画像の場合、売上が高い順にオーダー日の年を並べ替えることができます。

  • 「色」を設定すると、バラけた色が設定される
    • 上記のVizに対して、「オーダー日(年)」で色分けをしてみます。
    • すると、バラバラな色が設定されます。不連続は「それぞれの値が独立している」以上、値は別個のものとして扱われるため、色もバラバラなものが振り分けられます。(色については「連続」と比べるとわかりやすいです)

少しはイメージが掴めたでしょうか。たぶんまだしっくりこないと思いますが、次の「連続」も見てみると、だいぶしっくりくると思います。

連続とは

連続の概念

不連続の逆となります。

不連続の説明の例で挙げた「1〜10」という値ですが、これを「連続」として扱った場合はどうなるでしょうか。その名の通り、1から10までの連続した値となります。1から10まで連続しているので、例えば11や20といった数値が入ることは有り得ません。また、「連続している」以上、中の数値の順序が変わることもありません。

連続を使用してみる

この画像は、上記の不連続の例で作成したVizを少し変えたのものです。具体的には「オーダー日(年)」を「連続」に変えたものになります。(Vizとしては、非常に見難いですが、不連続との比較のため、このままにします)

  • ヘッダーではなく「軸」が表示される
    • 不連続では、それぞれの「年という値」がヘッダーとして表示されていましたが、連続では「軸」として表示されます。
    • 1本の軸なので、左から右に、年が表示されています。
  • 並び替えができない
    • これはわかりやすい特徴かと思います。この場合は日付データを連続としていますが、連なっている時間(日付)を並び替えることはできません。
    • 下記画像を見ていただければわかると思いますが、並び替えのメニューが選択できないようになります。

  • 「色」を設定すると、連続した値の大小によって濃淡が表現される
    • これもわかりやすい特徴ですね。不連続の時と同じように、色を設定みると、青を基調として、濃淡の違いで色が表現されています。(下記画像参照)
    • 不連続と違い、値は独立しているわけではなく、1つの繋がった値のため、このようになります。

おわりに

今回は「不連続」と「連続」について見てきました。概念が違うのは当たり前として、実際に機能の仕様まで変わってきます。項目を右クリックすれば、不連続と連続は相互に変換できるので、作成しようとしているVizに合わせてうまく使い分けてみたいと思います。

参考