EXCELユーザーのためのAlteryx入門 (5).結合処理編 #alteryx
EXCELユーザーがAlteryxを使うための"入門編的エントリ"としてトピック別にその内容をご紹介するシリーズ「EXCELユーザーのためのAlteryx入門」。当エントリでは「結合処理編」としてデータの整形・不要なデータを加工の過程で削ぎ落とす際に使えそうなトピックについてご紹介して行きたいと思います。
目次
データの追加
EXCELの場合
EXCELでデータの結合を行う場合、「2つのテーブルの列が全く同じで」「同じ順序である」事をまず確認し、次に片方のテーブル内容全体をコピーしてもう片方のテーブルの空行に貼り付ける...というような作業を行う必要があります。
Alteryxの場合
Alteryxではこの作業をもっと簡単に行う事が出来ます。「Union Tool」を使う事で、各列の位置を維持しながら、フィールド名に基いて複数のワークシートを組み合わせる事が出来ます。各ワークシートの列ヘッダーの順序を簡単に変更して一致させることができます。
Union Toolを使ってユニオン(結合)させたいデータを複数繋げてアウトプットも併せて指定。結合の方法には幾つか選択肢があるようです。
タスク実行。今回は2つのファイルを項目名でユニオン(結合)させてみましたが、ちゃんと件数的にも1つにまとまったようです。
データのブレンド(VLOOKUPS)
EXCELの場合
Excelを使用すると、複数のワークシートを結合するために、VLOOKUP式またはINDEX MATCH式を使用して、異なるソースまたはテーブルのデータセットに情報を取り込むことができます。
Alteryxの場合
同様の作業をAlteryxで行う場合は「Join tool」を使うことで共通のフィールド(主キー)を持つ2つのテーブルを下記に記す方法で結合させる事が出来ます。
データとして振り分けられるのは以下の3セットとなります。
- 内部結合(J):照合するテーブルの値(R)があるソーステーブル(L)の右側に新しい列を作成出来たもの。
- 左辺結合(L):左側に結合元のテーブル、右側は結合するテーブルで条件に合致しなかったもの
- 右辺結合(R):右側に結合元のテーブル、左側は結合するテーブルで条件に合致しなかったもの
データベース内のデータを操作する場合は、「In-DB Join Tool」を利用することもできます。 このツールを使用すると、データベースからデータを移動することなく大規模なデータセットに対してブレンディングと分析を行うことができ、従来の分析メソッドよりも大幅にパフォーマンスが向上します。「In-DB Join Tool」を使用すると、内側、左側、右側、さらには完全結合を行うことができます。
まとめ
という訳で「EXCELユーザーのためのAlteryx入門」第5弾、「結合処理編」としてEXCELでデータの変換処理を行う際の作業の"Alteryx化"への道筋を概略の形ではありますが紹介したエントリでした。
全5本のエントリに渡ってご紹介してきたこのシリーズ、Alteryxのタスクの豊富さ・充実さを改めて感じる次第となりました。日々実践している作業を見つめ直して処理を解析を行い、Alteryxのタスク処理に相当する内容に置き換える事で作業内容も整理され、実施効率も改善される事が期待出来るかと思います。これをお読みになった皆様も是非一度、実践してみてはいかがでしょうか。
参考情報:
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。