Tableau 10.2新機能:自動の DATEPARSE機能について #tableau
Tableauは現時点(2017年08月末)時点での最新バージョンは10.3であり、当ブログでも新バージョンが出る度に都度機能紹介を行ってきましたが、紹介仕切れていない機能も幾つかありました。そこで当エントリではバージョン10以降(10.1〜10.3)のマイナーバージョンリリースで発表された新機能の中で紹介を出来ていなかったものについて改めておさらいする形で紹介してみようと思います。
当エントリで紹介する機能はバージョン10.2での登場となった「自動のDATEPARSE機能」です。
Tableau 10.2 | Tableau Software
自動のDATEPARSE機能について
分析する際の「データの在り方」として、日付データについては分析がしやすくなるように、また理解がしやすくなるように「2017/08/30」や「2017-08-30 12:34:56」のような形で所定のフォーマットに基づいた形でフォーマット(表示形式)を整えておく事が推奨されます。Tableauではこの部分について設定を整えておく(テキスト形式の場合であれば認識可能なフォーマットに、データベースであればテーブルのカラムを日付(DATE)型、日付時刻(TIMESTAMP)型などに定義しておくと自動で日付や日付時刻の情報として認識してくれるようになります。
今回ご紹介する「自動のDATEPARSE機能」は、上記のような形で日付や日付時刻として認識されていない文字列データの場合でも、所定の操作を行う事でTableau側でデータを認識し、日付(日付時刻)データとして解釈・活用出来るようになるというものとなります。
では早速試してみましょう。以下のような形でケースとして有り得そうな表示形式のデータをテキストデータとして見繕ってみました。
日付表記(年月日のみ/スラッシュ区切り) 日付表記(年月日のみ/ハイフン区切り) 日付表記(年月日のみ/区切り文字なし) RFC 2822形式(日付まで) 日本語表記(日付まで) UnixTime 日付表記(日付時刻まで) ハイフン区切り(日付時刻まで) 日本語表記(日付時刻まで/曜日含む) ISO 8601形式 RFC 2822形式 2017/08/30 2017-08-30 20170830 Aug 30,2017 2017年08月30日 1504064096 2017/08/30 12:34:56 2017-08-30 12:34:56 2017年08月30日 水曜日 12時34分56秒 2017-08-30T12:34:56+09:00 Wed, 30 Aug 2017 12:34:56 +0900 2017/08/29 2017-08-29 20170829 Aug 29,2017 2017年08月29日 1504018799 2017/08/29 23:59:59 2017-08-29 23:59:59 2017年08月29日 火曜日 23時59分59秒 2017-08-29T23:59:59+09:00 Tue, 29 Aug 2017 23:59:59 +0900 2017/08/28 2017-08-28 20170828 Aug 28,2017 2017年08月28日 1503849723 2017/08/28 01:02:03 2017-08-28 01:02:03 2017年08月28日 月曜日 01時02分03秒 2017-08-28T01:02:03+09:00 Mon, 28 Aug 2017 01:02:03 +0900
まずはオーソドックスなものから。スラッシュ区切り、ハイフン区切り、区切り文字無しの日付データ(YYYYMMDD)の場合は何もせずともデータの内容を日付データとして認識してくれました。
同じ感じで日付時刻形式の内容についても見てみます。こちらはスラッシュ区切り・ハイフン区切りについては上記同様、自動で認識してくれていますね。区切り文字無しのデータは文字列のままです。
ここで、データ型の部分をクリックして「日付と時刻」への変換を試みてみます。上手く変換出来ました!
RFC2822形式、また日本語が含まれている形式についても日付型データとして認識してくれました。
UnixTimeについては「日付」及び「日付と時刻」についてそれぞれ試してみましたが変換は出来ませんでした。
日付時刻の日本語表記(曜日も含む)も試してみました。こちらについては若干精度に不安があるような変換結果となってしまっています。
ISO 8601形式、RFC 2822形式もそれぞれ試してみました。前者は上手く変換出来ていますが後者は難しいようです。
まとめ
という訳でTableau 10.2の新機能「自動の DATEPARSE機能」に関する振り返り紹介でした。今回は非常に少ないサンプルでの動作検証となり、特に変換処理等に時間を食うという事はありませんでしたがデータが大量な件数ともなると項目の認識・変換に関するパフォーマンスも気になるところです。Tableau側に余計な処理をさせなくて済むのであればそれに越した事はありませんので、可能であれば事前にETLやELT処理などで日付・日付時刻型のフォーマットに変換しておく事が望ましいでしょう。