Challenge #72: Compare Data Sets (Fields/Columns) ~データセットの比較~ – Alteryx Weekly Challenge

こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。

当エントリは『Alteryx Weekly Challenge:Intermediate Level Advent Calendar 2018』の23日目です。

『Alteryx Weekly Challenge:Intermediate Level Advent Calendar 2018』では、Alteryx Communityで公開されているWeekly ChallengeのIntermediate Levelにひたすら1人で挑戦していきます。

今回はデータセットの比較に挑戦します。

動作環境

当エントリの執筆には、以下の環境を利用しています。

  • Windows 10 Pro
  • Alteryx Designer 2018.4.4.54346 英語版

Challenge #72: Compare Data Sets (Fields/Columns)

お題

今回挑戦するお題はこちら。
※配布されているワークフローに69と記載されていますが、72番のお題です。

「Input」側には2つデータが用意されています。1つ目のデータはこちら。

2つ目のデータはこちら。

「Output」側のデータはこちら。2つのデータのフィールド名を比較しています。

解答の概要

今回作成するワークフローは以下の通りです。

  1. フィールド名の準備
  2. フィールド名の比較

フィールド名の準備

2つのデータに対して処理を行いますが、使用するツールと設定は共通しています。

Transposeツール(Transform -> Transpose)を使用して、データを縦持ちに変換します。

Uniqueツール(Preparation -> Unique)を使用して、フィールド名を抽出します。

Record IDツール(Preparation -> Record ID)を使用して、IDを付与します。

Data Cleansingツール(Preparation -> Data Cleansing)を使用して、フィールド名を全て大文字に変換し、アンダースコアや空白を取り除きます。

Joinツール(Join -> Join)を使用して、元のフィールド名と大文字に変換したフィールド名を結合します。不要な列の削除と、元のフィールド名がある列の名前を設定します。

これで元のフィールド名と大文字に変換したフィールド名を準備できました。

フィールド名の比較

Joinツールを使用して2つのデータを結合します。データの結合には、大文字に変換したフィールド名を使用します。

Unionツール(Join -> Union)を使用して、Joinツールの LJR から出力されるデータを結合します。データの結合には Auto Config by Name を使用しています。

Selectツール(Preparation -> Select)を使用して、不要な列を削除します。

結果を確認して完成です。

最後に

今回はWeekly ChallengeのChallenge #72: Compare Data Sets (Fields/Columns)に挑戦しました。

明日もお楽しみに!

サンプルワークフローのご案内

クラスメソッドでご契約のユーザー様向けに、当ブログでご紹介したワークフローを専用ポータルにて公開しております。当エントリでご紹介したワークフローも公開予定ですので、ご参考にしていただきますと幸いです。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400