Tableau 10.2新機能:自動の DATEPARSE機能について #tableau

2017.08.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Tableauは現時点(2017年08月末)時点での最新バージョンは10.3であり、当ブログでも新バージョンが出る度に都度機能紹介を行ってきましたが、紹介仕切れていない機能も幾つかありました。そこで当エントリではバージョン10以降(10.1〜10.3)のマイナーバージョンリリースで発表された新機能の中で紹介を出来ていなかったものについて改めておさらいする形で紹介してみようと思います。

※検証する機能は10.2で初出となるものですが、動作確認・検証については 現時点(2017/08/30)での最新バージョンである10.3で行っています。

当エントリで紹介する機能はバージョン10.2での登場となった「自動のDATEPARSE機能」です。

Tableau 10.2 | Tableau Software

自動のDATEPARSE機能について

分析する際の「データの在り方」として、日付データについては分析がしやすくなるように、また理解がしやすくなるように「2017/08/30」や「2017-08-30 12:34:56」のような形で所定のフォーマットに基づいた形でフォーマット(表示形式)を整えておく事が推奨されます。Tableauではこの部分について設定を整えておく(テキスト形式の場合であれば認識可能なフォーマットに、データベースであればテーブルのカラムを日付(DATE)型、日付時刻(TIMESTAMP)型などに定義しておくと自動で日付や日付時刻の情報として認識してくれるようになります。

今回ご紹介する「自動のDATEPARSE機能」は、上記のような形で日付や日付時刻として認識されていない文字列データの場合でも、所定の操作を行う事でTableau側でデータを認識し、日付(日付時刻)データとして解釈・活用出来るようになるというものとなります。

では早速試してみましょう。以下のような形でケースとして有り得そうな表示形式のデータをテキストデータとして見繕ってみました。

dateparse-samples.tsv

日付表記(年月日のみ/スラッシュ区切り)	日付表記(年月日のみ/ハイフン区切り)	日付表記(年月日のみ/区切り文字なし)	RFC 2822形式(日付まで)	日本語表記(日付まで)	UnixTime	日付表記(日付時刻まで)	ハイフン区切り(日付時刻まで)	日本語表記(日付時刻まで/曜日含む)	ISO 8601形式	RFC 2822形式
2017/08/30	2017-08-30	20170830	Aug 30,2017	2017年08月30日	1504064096	2017/08/30 12:34:56	2017-08-30 12:34:56	2017年08月30日 水曜日 12時34分56秒	2017-08-30T12:34:56+09:00	Wed, 30 Aug 2017 12:34:56 +0900
2017/08/29	2017-08-29	20170829	Aug 29,2017	2017年08月29日	1504018799	2017/08/29 23:59:59	2017-08-29 23:59:59	2017年08月29日 火曜日 23時59分59秒	2017-08-29T23:59:59+09:00	Tue, 29 Aug 2017 23:59:59 +0900
2017/08/28	2017-08-28	20170828	Aug 28,2017	2017年08月28日	1503849723	2017/08/28 01:02:03	2017-08-28 01:02:03	2017年08月28日 月曜日 01時02分03秒	2017-08-28T01:02:03+09:00	Mon, 28 Aug 2017 01:02:03 +0900

まずはオーソドックスなものから。スラッシュ区切り、ハイフン区切り、区切り文字無しの日付データ(YYYYMMDD)の場合は何もせずともデータの内容を日付データとして認識してくれました。

tableau102-new-features-auto-dateparse_01

同じ感じで日付時刻形式の内容についても見てみます。こちらはスラッシュ区切り・ハイフン区切りについては上記同様、自動で認識してくれていますね。区切り文字無しのデータは文字列のままです。

ここで、データ型の部分をクリックして「日付と時刻」への変換を試みてみます。上手く変換出来ました!

tableau102-new-features-auto-dateparse_03 tableau102-new-features-auto-dateparse_04

RFC2822形式、また日本語が含まれている形式についても日付型データとして認識してくれました。

tableau102-new-features-auto-dateparse_05

tableau102-new-features-auto-dateparse_06

UnixTimeについては「日付」及び「日付と時刻」についてそれぞれ試してみましたが変換は出来ませんでした。

tableau102-new-features-auto-dateparse_07 tableau102-new-features-auto-dateparse_08

日付時刻の日本語表記(曜日も含む)も試してみました。こちらについては若干精度に不安があるような変換結果となってしまっています。

tableau102-new-features-auto-dateparse_09 tableau102-new-features-auto-dateparse_10

ISO 8601形式、RFC 2822形式もそれぞれ試してみました。前者は上手く変換出来ていますが後者は難しいようです。

tableau102-new-features-auto-dateparse_11 tableau102-new-features-auto-dateparse_12

まとめ

という訳でTableau 10.2の新機能「自動の DATEPARSE機能」に関する振り返り紹介でした。今回は非常に少ないサンプルでの動作検証となり、特に変換処理等に時間を食うという事はありませんでしたがデータが大量な件数ともなると項目の認識・変換に関するパフォーマンスも気になるところです。Tableau側に余計な処理をさせなくて済むのであればそれに越した事はありませんので、可能であれば事前にETLやELT処理などで日付・日付時刻型のフォーマットに変換しておく事が望ましいでしょう。

参考情報: