[Alteryx] Browse ToolのProfileを見る

こんにちは、小澤です。

今回はAlteryx11.0からの新機能であるProfileについて紹介します。

Profileとは

Alteryx11.0からBrowse Toolを使って見ることができるようになった情報です。 以前のバージョンだとBrowse Toolでは何も表示されていなかった、左側のConfigurationにデータの統計情報が表示されます。

スクリーンショット 2017-04-27 15.30.56

Profileはデータを見ながら分析のWorkflowを作成していくのに便利な、簡易的な統計情報可視化のための機能です。 複雑な分析や可視化に関しては、各種ツールが存在するため、単一の変数に対する情報のみとなりますが、これだけでも便利な場面も多くあります。

実際に見てみる

では、このProfileにどのようなものが表示されるのか実際に見てみましょう。 表示される内容は、変数の型によってことなります。 今回は数値、文字列と日付の場合について見ていきます。

予備知識

Profileではデフォルトで一番左側の変数に関する情報が表示されます。 他の変数の情報を見たい場合は、従来通りデータが表示されているResultsから、見たい変数の列のどこか(列名または個々の値)をクリックすることで切り替えることができます。

数値の場合

数値の場合、以下のような情報が表示されます。

スクリーンショット 2017-04-27 16.05.59

上部のグラフでは、横軸が個々のデータ、縦軸が値となっています。 この情報でデータの大まかな分布をつかむことができます。 また、マウスオーバーで個々の点の実際の値が表示されます。

複数の異なる性質を持つデータが入り混じっている場合は、以下のようにそれを見てとれるかと思います。

スクリーンショット 2017-04-27 16.12.40

その下にあるのは箱ひげ図です。 こちらもデータ全体の分布や平均、中央値などをざっくりとみることができ、マウスオーバーで数値も確認できます。

スクリーンショット 2017-04-27 16.16.12

その下のテーブルには各種統計量が表示されます。 欠損値の数なども表示されています。

スクリーンショット 2017-04-27 16.19.40

文字列の場合

文字列の場合も基本的な構成は数値と同じです。

スクリーンショット 2017-04-27 16.21.24

グラフの部分は各値ごとのカウントした棒グラフになっています。 また、空文字や欠損値の割合などもその下の帯グラフで確認できるようになっています。

その下の統計情報も、平均や分散などではなく、文字列に関するじょうほうとなっています。

日付の場合

日付の場合、単体ではこれまでの2つ大きな違いはありません。 数値の隣に、日付のカラムがある場合のみ、特殊なProfileを確認することができます。

数値と日付が並んでいるデータで、数値のProfileを見ると上部に下のようなアイコンが表示されます。

スクリーンショット 2017-04-27 18.55.30

ここで、棒グラフのアイコンか右の矢印をクリックするとグラフ部分が下のような表示に切り替わります。

スクリーンショット 2017-04-27 18.56.48

ここでは、日付ごとにグループ化した数値のカラムの合計値がグラフとして表示されます。

終わりに

今回はAlteryx 11.0から搭載されたBrowse ToolのProfile機能を紹介しました。 単一の変数の値の確認で、表示をカスタマイズするなどはできませんが、 入力として利用するデータや複雑なWorkflowを組み立てる際の途中のデータを確認する際に、そのためだけに本来のフローには必要ない処理を作成する必要がなくなるため、便利に使えるのではないかと思います。