Tableauの散布図を使って標準偏差からデータのばらつきを確認する

標準偏差

ある集団についてデータがどのように分布しているか調べたい時、散布図を用いることが多いと思いますが、そのとき用いられるのが標準偏差です。Tableauには、散布図と標準偏差を分かりやすく表す機能がありますのでやってみたいと思います!

散布図を作成

まず始めに、発送費用と利益の関係を見るために散布図を作成します。列と行にそれぞれ指定します。

screenshot 2014-08-29 1.45.26

散布図を指定します。

screenshot 2014-08-29 1.45.43

次に、オーダーIDをプロットします。

screenshot 2014-08-29 1.46.56

ラベルに顧客名を付けます。

screenshot 2014-08-29 1.47.29

地域ごとに色分けをしてみます。

screenshot 2014-08-29 1.47.40

それっぽく見えてきましたね!

標準偏差を帯で表す

それでは、標準偏差の帯で表したいと思います。行を選択してバンドの追加をします。

screenshot 2014-08-29 1.47.54

標準偏差を選んで、「-1,+1」を指定します。

screenshot 2014-08-29 1.48.08

同じように列も指定してください。結果は以下のようになりました。

screenshot 2014-08-29 1.48.50

ばらつき具合い

標準偏差は、データのばらつきを確認するものと紹介しましたが、「-1,+1」とは何でしょうか?これは、正規分布表で見ると分かりやすいですね。「-1,+1」は、約68%の枠の中に入っているか確認できます。

normdistprobfig

まとめ

今回は、Tableauを使って、散布図の作成と標準偏差を使ったデータのばらつきを確認できました。データ分析の際に、全体を俯瞰した後、データのばらつきを見て、例外的な値を外したりすることができます。