Tableauの関数を全て試してみる〜集計関数編その3〜 #tableau

2017.12.19

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんにちは。DI部のtama@奈良県です。

当エントリはTableau Functions Advent Calendar 2017の19日目のエントリです。 昨日のエントリはTableauの関数を全て試してみる〜集計関数編その2〜でした。

今回も引き続き、集計関数を見ていきます。 ※MIN関数は「数値関数その3」で紹介したので、省いています。

  • 使用するTableauのバージョンは一貫して10.4.1です。
  • 各関数の説明で引用しているのは、Tableauの公式リファレンスからの引用です。
  • TableauHelp 関数

目次

検証環境

作業環境

  • MacOS High Sierra 10.13.1
  • Tableau 10.4.1

使用データ

  • (原則)Tableau付属のサンプルスーパーストア
  • (場合によって)関数グラフ描画用データ
  • -1〜1の範囲で、0.01毎に値が並んでいるデータ
  • 上記の値をディメンション「X軸」とし、その上に色々な関数をプロットする。
  • 参考:Tableau 関数グラフの描画 | Developers.IO

PERCENTILE(expression, number)

概要

指定された数字に対応する指定された式の百分位値を返します。数値は 0 と 1 (包含) の間である必要があります — たとえば、0.66 は数値定数にする必要があります。

  • 引数に指定した値を、任意の値の分位にあたる数を返す関数です。
  • 使用できるデータソースが限られています。下記を参照してください。
  • Tabelau_集計関数

使ってみた

「売上」の0.5、つまり半分にあたる位置を算出します。

PERCENTILE([売上],0.5)

オーダーID毎に算出しました。 しかし、この画面だけだと、どう算出されているかわかりにくいので、一番上の行のデータを詳しく見てみます。

このオーダーIDには3つ売上が存在しますが、今回は「0.5」を指定しているので、ちょうど真ん中にあたる「6780」が算出されています。 オーダーIDに紐づく「売上」が1件しかない場合は、それが返ることになります。(関数でどの位置を指定しても、その1件しか該当するデータがないため)

どういう時に使う?

参考文献

STDEV(expression)

概要

サンプル母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。

STDEVP(expression)

概要

バイアス母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。

  • 「標準偏差」を返す関数です。
  • 標準偏差を簡単に説明すると、「そのデータのばらつきの大きさを表す値」となります。
  • 両者の違いは「サンプル母集団(標本標準偏差)」か「バイアス母集団(母標準偏差)」のどちらに基いて算出するか、です。
  • 両者の違いについては、エクセル:標本標準偏差と母標準偏差をご覧ください。

※標準偏差の詳しい解説は、下記の参考文献に載せているリンク等をご覧ください。

使ってみた

「そのデータ全てを母集団として」計算してみたいので、STDEVP関数を使用してみます。

STDEVP([利益])

年別にしてみたところ、2015年が一番値が大きい結果となりました。2015年が、利益というデータのばらつきが一番大きいということになります。 これが、もっと目立った結果となっている場合、そのデータには何らかの異常値(特異値)が含まれている可能性が高いので、分析のアクションも進むかと思います。

どういう時に使う?

  • データのばらつきを調べたいとき
  • 異常値(特異値)を見つけることは、分析では重要です。異常値に引っ張られた分析結果を使用してしまうと、そこから起こす次のアクションもズレたものになってしまいます。

参考文献

おわりに

引き続き集計関数について見てきました。 STDEV関数のような、統計値を出す関数も用意されているため、もう少し深い分析も可能かと思います。

次回はtamaによる「Tableauの関数を全て試してみる〜集計関数編その4」です。お楽しみに。