【レポート】トレーニングセッション:Alteryx Designer for Excel Users – Alteryx Inspire 2023

Excel is not a database
2023.06.11

こんにちは、スズです。

現地時間の2023年5月22日(月)~5月25日(木)に、ラスベガスにてAlteryx Inspire 2023が開催されました。本記事では、Alteryx Inspire 2023で開催されたトレーニングセッション『Alteryx Designer for Excel Users』についてお届けします。

セッション概要(日本語訳)

Excelでデータを更新したり操作することに、時間を費やしていることに気づいていますか?このセッションでは、一般的なExcel関数を繰り返し利用可能で自動化されたAlteryxワークフローに移行し、その時間を取り戻す方法に焦点を当てます!

セッションレポート

講師紹介

  • Albert Bellamy, Customer Training Instructor

Use Case

  • 顧客取引データの分析に使われるExcelが作成された
    • 再現に時間がかかり、エラーが発生しやすい
  • Excelで同じETLやデータの前処理を何度もやったことがある人はいますか?
    • Excelの魔術師に「マクロをマスターすればいいよ」と言われたことがある人はいますか?
    • VBAやコードでコーディングする方法を学び、Power Pivot、Power Queryを使用する
  • ここで我々が行いたいことは、手間のかかるプロセスでエラーが発生する根本的な部分を、動的で設計しやすいモデルに置き換え、再現できるようにすること

Key Concepts

  • タスクに対してExcelとAlteryxでそれぞれどのように処理を行うのかを解説する

  • カラムの削除、変更、データ型の変更など
    • Excel
      • 対象をハイライト、右クリックしてデータ型を変更
      • Ctrl + CやCtrl + V、Ctrl + Xを駆使して列の並べ替え
    • Alteryx
      • セレクトツールを使う
      • オートフィールドツールでデータ型を自動判別
  • 行のフィルター
    • Excel
      • フィルターした状態でも片隅に小さく印が表示されるだけのため、フィルターされている状態か気付きづらい
      • フィルターに対して偽の結果に処理を続けることができない
    • Alteryx
      • フィルターツールでパラメータを構築できる
  • 並べ替え
    • Excel
      • 数式や関数を使用する
      • Excelには付箋、付箋のないセルの参照、アンカー付きのセルの参照、ネストされた関数などが使われ、他のエンジニアがこの機能を理解するのは時間がかかる
    • Alteryx
      • ソートツールできれいに並べ替え可能

  • フォーミュラ
    • Alteryx
      • 複数行フォーミュラツール、複数フィールドフォーミュラツールでは、複数の行やフィールドに対して適用できる

  • 結合、ユニオン
    • Excel
      • VLOOKUP関数を使うと非常に大規模になる
    • Alteryx
      • SQLの結合も結合ツールとユニオンツールを使って再現できる
      • 結合ツールでは、名前や位置で結合できる
      • ユニオンツールは北と南を一緒にする

  • 変換
    • Alteryx
      • クロスタブツール、転置ツールは、何かを他のものに変えてしまうことがないこと
      • 2つのツールがあるため、Excelのピボットテーブルに慣れている人は、初めは直観的に理解できないかもしれない

Ctoss Tab

  • 2人の生徒の英語と数学の成績
  • Beforeのデータに対して、Nameでグループ化し、Classをヘッダー、Gradeを値にしてクロスタブツールを使うと、Afterのデータのようになる

Pivot Tables versus Cross Tab

  • Excelで行うピボットと、Alteryxのクロスタブツールの設定
  • 1番では軸になる列を設定
    • 先の例のように、生徒の名前は値になる
  • 2番では列のヘッダーを設定
  • 3番と4番では出力する値の設定
    • 平均値やパーセントなど、値を集約する

ハンズオン

スライドでの解説の後は、各処理についてExcelの場合とAlteryxの場合とを解説を受けつつ、実際にワークフローの作成を行いました。作成したワークフローの全体図はこちらです。

作成したワークフローの各ステップごとの処理の内容と使ったツールについて、簡単にご紹介します。

  1. 全てのトランザクションデータを読み込み
    • データ入力ツール
      2つのトランザクションデータの読み込み
    • ユニオンツール
  2. 不要なフィールドの削除、データ型の修正、列の名前の修正
    • セレクトツール
  3. 日付を表す文字列を日付型への変換
    • 日時ツール
  4. ID列の先頭に0の追加、数量 * 単価の計算
    • フォーミュラツール
  5. 配送方法ごとの顧客の消費金額の合計と取引回数
    • 集計ツール
  6. 顧客データとの照合
    • データ入力ツール
      照合するために顧客データの読み込み
    • 結合ツール
    • ユニオンツール
      LEFT OUTER JOINの処理
  7. 配送方法と、消費金額の昇順でソート
    • ソートツール
  8. 新しいExcelファイルへの出力
    • データ出力ツール

最後に

Alteryx Inspire 2023のトレーニングセッション『Alteryx Designer for Excel Users』のレポートをお届けしました。セッション中は質疑応答をしながら進んでいき、ときおり笑いも交えつつ、終始和やかなセッションでした。

余談ですが、ハンズオン中、何度か「Excel is not a database」というフレーズが登場しました。このフレーズは、2019年のAlteryx InspireでTシャツにもなっています。今回のAlteryx Inspireでも当時配布されたTシャツを持っている方や着ている方をお見掛けしました。記憶に残る印象的なフレーズですね。