AlteryxのTile(タイル)ツールのTile Method(タイル法)各種ご紹介

2019.03.29

こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。

今回はAlteryx DesignerのPreparation(準備)カテゴリにあるTile(タイル)ツールをご紹介いたします。

Tileツールとは

Tileツールとは、指定の列のデータを用いてレコードをグループに分けるツールです。AlteryxヘルプでのTileツールの紹介こちらです。

グループ化する方法として、Equal Records、Equal Sum、Smart Tile、Maunual、Unique Valueがあります。Tileツールにはサンプルが用意されていますので、サンプルを使って各種ご紹介していきます。サンプルはOpen Exampleから表示することができます。

なお、ブログで紹介するにはデータの量が多いので、Random % Sampleツールを使用してデータの量を少なくしています。

Equal Records (等しいレコード)

Equal Recordsでは、レコードの数ができるだけ等しくなるようにグループ化します。

以下のデータで試してみます。

設定はこちら。

  • Number of Tiles(タイルの数): 5
  • Don't Split Tile on Field(フィールド上でタイルを分割しない): なし
  • Sort Field(ソートフィールド): なし
  • Group Fields(グループ化フィールド): なし

「Tile_Num」列と「Tile_SequenceNum」列が追加されます。「Tile_Num」列がタイル番号(グループ番号)、「Tile_SequenceNum」列が各グループ内のシーケンス番号です。上のレコードから順に、5つのグループに分けています。

Don't Split Tile on Field(フィールド上でタイルを分割しない)

オプションのDon't Split Tile on Fieldを使用すると、連続するレコードが指定の列に同じ文字列がある場合は、グループを分けずに出力します。

以下のデータで試してみます。

設定はこちら。

  • Number of Tiles(タイルの数): 5
  • Don't Split Tile on Field(フィールド上でタイルを分割しない): 「CITY」列
  • Sort Field(ソートフィールド): なし
  • Group Fields(グループ化フィールド): なし

以下の画像の赤枠部分は「NANTUCKET」が連続しているので同じグループに所属しています。青枠部分はどちらも「BOSTON」ですが、連続していないためグループが分けられています。

Equal Sum(等和)

Equal Sumでは、選択した列の数値の合計ができるだけ等しくなるようにしてグループ分けを行います。

以下のデータで試してみます。

設定はこちら。

  • Number of Tiles(タイルの数): 5
  • Sort Field(ソートフィールド): なし
  • Sum Field(合計フィールド): 「AVERAGE SALE」列
  • Group Fields(グループ化フィールド): なし

上のレコードから順に、各グループの「AVERAGE SALE」列の合計が近くなるようにグループ化しています。

Summarizeツールを使ってグループごとに「AVERAGE SALE」列の合計を出力してみると、合計値が145~165となっています。

Smart Tile(スマートタイル)

Smart Tileは、標準偏差でグループ化を行います。

以下のデータで試してみます。

設定はこちら。

  • The Field(タイルフィールド): 「AVERAGE SALE」列
  • Output Verbose Name Field(詳細な名前フィールドを出力)
  • Group Fields(グループ化フィールド): なし

「Tile_Num」列「Tile_SequenceNum」列「SmartTile_Name」列が追加されます。

「Tile_Num」はデータの標準偏差に基づいて以下の範囲で割り当てられます。

範囲 タイル番号
平均 + (標準偏差 * 0.5) > AVERAGE_SALE >= 平均 + (標準偏差 * 1.5) 1
平均 - (標準偏差 * 0.5) > AVERAGE_SALE >= 平均 + (標準偏差 * 0.5) 0
平均 - (標準偏差 * 1.5) > AVERAGE_SALE >= 平均 - (標準偏差 * 0.5) -1

2以上や-2以下についても同様の基準で範囲が計算されます。

Tile_Numの値

各タイル番号が割り当てられる数値の範囲についてはSmartTile_Nameで確認できます。

Tile_Numの割り当て範囲

Manual(マニュアル)

Manualは手動でグループ範囲を設定できます。

以下のデータで試してみます。

設定はこちら。

  • The Field(タイルフィールド): 「AVERAGE SALE」列
  • Enter 1 or More Tile Cutoffs(1つまたは複数のタイルカットオフを入力): グループを入力
  • Group Fields(グループ化フィールド): なし

10、50、100、500と入力していますので、「AVERAGE SALE」列の数値が10まで、50まで、100まででグループが分かれています。
※「AVERAGE SALE」列に100以上の数値がないため、3つのグループに分かれています。

Unique Value(固有値)

Unique Valueは、指定の列の値が同じ場合は同じグループに設定します。

以下のデータで試してみます。

設定はこちら。

  • Unique Fields(固有のフィールド): 「AVERAGE SALE」列
  • Group Fields(グループ化フィールド): なし

結果はこちら。

「AVERAGE SALE」列が昇順で並べ替えられています。同じ数値があるレコードは同じグループに所属しています。

Leave Unsorted(未分類のままにする)を使用した場合は並べ替えは行われません。この場合、同じ文字列や数値であっても、連続したレコードではない場合は異なるグループになります。

最後に

今回はサンプルを使ってTileツールについてご紹介しました。これまであまり使っていないツールでしたが、サンプルを使って設定やデータを確認していくことで、ツールの使い方の勉強になりました。他のツールについてもサンプルを使って勉強していきたいと思います。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400