AlteryxのTile(タイル)ツールのTile Method(タイル法)各種ご紹介
こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。
今回はAlteryx DesignerのPreparation(準備)カテゴリにあるTile(タイル)ツールをご紹介いたします。
Tileツールとは
Tileツールとは、指定の列のデータを用いてレコードをグループに分けるツールです。AlteryxヘルプでのTileツールの紹介こちらです。
グループ化する方法として、Equal Records、Equal Sum、Smart Tile、Maunual、Unique Valueがあります。Tileツールにはサンプルが用意されていますので、サンプルを使って各種ご紹介していきます。サンプルはOpen Exampleから表示することができます。
なお、ブログで紹介するにはデータの量が多いので、Random % Sampleツールを使用してデータの量を少なくしています。
Equal Records (等しいレコード)
Equal Recordsでは、レコードの数ができるだけ等しくなるようにグループ化します。
以下のデータで試してみます。
設定はこちら。
- Number of Tiles(タイルの数): 5
- Don't Split Tile on Field(フィールド上でタイルを分割しない): なし
- Sort Field(ソートフィールド): なし
- Group Fields(グループ化フィールド): なし
「Tile_Num」列と「Tile_SequenceNum」列が追加されます。「Tile_Num」列がタイル番号(グループ番号)、「Tile_SequenceNum」列が各グループ内のシーケンス番号です。上のレコードから順に、5つのグループに分けています。
Don't Split Tile on Field(フィールド上でタイルを分割しない)
オプションのDon't Split Tile on Fieldを使用すると、連続するレコードが指定の列に同じ文字列がある場合は、グループを分けずに出力します。
以下のデータで試してみます。
設定はこちら。
- Number of Tiles(タイルの数): 5
- Don't Split Tile on Field(フィールド上でタイルを分割しない): 「CITY」列
- Sort Field(ソートフィールド): なし
- Group Fields(グループ化フィールド): なし
以下の画像の赤枠部分は「NANTUCKET」が連続しているので同じグループに所属しています。青枠部分はどちらも「BOSTON」ですが、連続していないためグループが分けられています。
Equal Sum(等和)
Equal Sumでは、選択した列の数値の合計ができるだけ等しくなるようにしてグループ分けを行います。
以下のデータで試してみます。
設定はこちら。
- Number of Tiles(タイルの数): 5
- Sort Field(ソートフィールド): なし
- Sum Field(合計フィールド): 「AVERAGE SALE」列
- Group Fields(グループ化フィールド): なし
上のレコードから順に、各グループの「AVERAGE SALE」列の合計が近くなるようにグループ化しています。
Summarizeツールを使ってグループごとに「AVERAGE SALE」列の合計を出力してみると、合計値が145~165となっています。
Smart Tile(スマートタイル)
Smart Tileは、標準偏差でグループ化を行います。
以下のデータで試してみます。
設定はこちら。
- The Field(タイルフィールド): 「AVERAGE SALE」列
- Output Verbose Name Field(詳細な名前フィールドを出力)
- Group Fields(グループ化フィールド): なし
「Tile_Num」列「Tile_SequenceNum」列「SmartTile_Name」列が追加されます。
「Tile_Num」はデータの標準偏差に基づいて以下の範囲で割り当てられます。
範囲 | タイル番号 |
---|---|
平均 + (標準偏差 * 0.5) > AVERAGE_SALE >= 平均 + (標準偏差 * 1.5) | 1 |
平均 - (標準偏差 * 0.5) > AVERAGE_SALE >= 平均 + (標準偏差 * 0.5) | 0 |
平均 - (標準偏差 * 1.5) > AVERAGE_SALE >= 平均 - (標準偏差 * 0.5) | -1 |
2以上や-2以下についても同様の基準で範囲が計算されます。
各タイル番号が割り当てられる数値の範囲についてはSmartTile_Nameで確認できます。
Manual(マニュアル)
Manualは手動でグループ範囲を設定できます。
以下のデータで試してみます。
設定はこちら。
- The Field(タイルフィールド): 「AVERAGE SALE」列
- Enter 1 or More Tile Cutoffs(1つまたは複数のタイルカットオフを入力): グループを入力
- Group Fields(グループ化フィールド): なし
10、50、100、500と入力していますので、「AVERAGE SALE」列の数値が10まで、50まで、100まででグループが分かれています。
※「AVERAGE SALE」列に100以上の数値がないため、3つのグループに分かれています。
Unique Value(固有値)
Unique Valueは、指定の列の値が同じ場合は同じグループに設定します。
以下のデータで試してみます。
設定はこちら。
- Unique Fields(固有のフィールド): 「AVERAGE SALE」列
- Group Fields(グループ化フィールド): なし
結果はこちら。
「AVERAGE SALE」列が昇順で並べ替えられています。同じ数値があるレコードは同じグループに所属しています。
Leave Unsorted(未分類のままにする)を使用した場合は並べ替えは行われません。この場合、同じ文字列や数値であっても、連続したレコードではない場合は異なるグループになります。
最後に
今回はサンプルを使ってTileツールについてご紹介しました。これまであまり使っていないツールでしたが、サンプルを使って設定やデータを確認していくことで、ツールの使い方の勉強になりました。他のツールについてもサンプルを使って勉強していきたいと思います。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。