Alteryxでレポーティング出力してみる
こんにちは、小澤です。
今回はAlteryxでデータ全体像をざっくりと眺めたり、データの傾向をまとめたりしたものをPDFやHTMLで出力してみます。 扱うデータはUCIにあるおなじみのIrisデータセットを利用します。
出力
さて、今回は最初にどのようなものが出力されるのか見てみます。
データ全件は長くなるので省略しています。 画像のように、各特徴のヒストグラム、統計情報、データといった情報をまとめています。 このように要約してみると、petal.length,widthのヒストグラムを見ると他と違って小さい傾向にある品種がありそうだなどといった情報がざっくりとわかるかとかと思います。 また、画像はPDF出力を行ったものとなっています。 このようにPDFやHTMLとして出力することでレポーティング情報としてまとめることができます。
ワークフロー
では、これを実現する方法を見ていきます。 まずはワークフロー全体像となります。
これをいくつかのパーツに分けて解説していきます。
データ全件のテーブル
最初は一番上のデータ全件の情報をテーブル化している部分になります。 Tableツールを利用することで、最終出力のテーブルのようなレイアウトを作成することができます。
設定の変更は一箇所のみです。 Per Column Configurationにあるspeciesを除く4つのカラムのDec. Placesを1に設定します。 これは小数点以下を1桁まで表示する設定を行っており、デフォルトでは0になっているため小数点以下が全て切り捨てられてしまいます。
Tableツールの次にあるのReport Textツールは文字列を追加するためのツールです。 最初に掲載した画像で「All Data:」と書いてある部分を追加しています。
Report Textツールの設定は
- Text ModeでAttch Text to existing filedを選択し既存のものに文字列を追加する
- Available Fieldsに「All Data:」を入力
の2つの設定を行っています。 今回は使っていませんがテキストに対する装飾なども行えます。
統計情報のテーブル
次に2段目では統計情報を取得し同様にテーブル化しています。 これを実現する方法は非常に簡単で、Field Summaryツールを使うのみとなります。
ツールの設定はSelect the fields produce summary infoで統計情報を取得したい項目を選択するのみです。 今回は文字列で品種名が記載されているspeciesを除いた全項目の情報を取得すします。
ここでの出力の一部は下の画像のようなものになります。
後続の処理は、このデータに対して全件の時と同様テーブル化を行っています。
ヒストグラムの生成
次にヒストグラムの作成を行います。 ヒストグラムを作成するにはそのままの名前のHistogramツールが使います。
このツールの使い方も非常に簡単です。Select the field to use in the histogramでヒストグラムを生成したい項目を選択するのみとなります。 今回はビン幅は指定しないのでautoのままで問題ありません。
これをsepal.length, sepal.width, petal.length, petal.widthの4つ分作成しているのが一番左の縦に4つ並んだ部分となります。 それぞれの項目について最初の画像のようなヒストグラムが作成されます。
次にこの4枚のヒストグラムを1つにまとめます。 最初の画像にあるように横に2つ、縦に2つのレイアウトにしたいためまずは横方向に2つずつ結合しています。 これにはJoinツールとLayoutツールを利用しています。
まず、Joinツールで2つのヒストグラムを結合します。 ヒストグラムデータは下の図のように1件のデータとして扱われています。
そのため、JoinツールでJoin by Record Positionを選択して結合することで2つの画像を結合することができます。
次にLayoutツールで横に2つのヒストグラムを並べた1つのデータにします。 Layout ConfigurationのOrientationでHorizontalを選択します。
さらにそのあと、横に2つ並んだヒストグラムのデータを同様にJoinツールで結合し、LayoutでOrientationをVerticalにすることで今度は縦に2つ並べています。 これで横に2つ、縦に2つのヒストグラムが並んだものができました。
全体の結合
必要なパーツが揃ったので、これら全体を結合します。 この方法は、ヒストグラムのレイアウトを行った時と同じ方法になります。 ここでは3つの要素を結合するため、Joinツールではなく、Join Mutipleツールを利用しています。
使い方はJoinツールと同様、Join by Record Positionでの結合となります。 結合後はLayoutツールでOrientationをVerticalにして3つの要素を結合しています。この際、出力の順番を整えるため、Per Row Configurationで順番を指定しています。
最後にRenderツールで出力を行います。
今回はデフォルトのままにしていますので、Temporary PDF Documentとして出力されます。 ここを変更することで任意のPDFやHTMLなどで出力することができます。
おわりに
Alteryxでいくつかの要素を組み合わせて1つ出力にまとめることができる例を示しました。 Alteryxでは様々な分析が可能なので、それらも同様に今回のようなやり方でまとめあげてレポーティングに使えるファイルを生成することが可能です。 多くの要素を盛り込んだないようにしようと思うとワークフロー全体として複雑化してしまうかもしれませんが、あまり多くのことを詰め込み過ぎるのもよくないので最終結果の組み立て部分が複雑になってきたら何が必須で何がなくてもいいといったことを考えてみるのもありかもしれません。