【レポート】トレーニングセッション:Alteryxの時系列モデリングによって未来を予測する #alteryx23

2023.07.18

こんにちは!アライアンス統括部のikumiです。現地時間2023年05月22日(月)〜2023年05月25日(木)に米国ラスベガスで開催されたAlteryxの年次カンファレンスイベント「Inspire 2023」。今回クラスメソッドからは計6人のメンバーが現地参戦してきました。

本記事では、5/23に行われた「Alteryxの時系列モデリングによって未来を予測する」について、その内容をお届けいたします。

セッション概要

  • セッションタイトル
    • See the Future: Time Series Modeling with Alteryx Machine Learning
  • スピーカー(敬称略)
    • Pier Bobys, Sr. Solutions Advisor, Alteryx
  • 概要
    • 過去の観測に基づいて、未来の行動を予測する方法を学びます。これは時間ベースのデータを扱う場合に特に役立つ分析手法となります。

セッション内容

本日学ぶ内容

このセッションでは、以下の内容を学んでいきました。

  • 時系列分析の基本概念
  • 時系列分析を行うにあたって必要なフィールド
  • Alteryxでの時系列分析のモデル構築

身近にある時系列データの例

  • 経済や金融のデータ、天気のデータ、医療データなど、これらは身近にある時系列データの一例です
  • 例えば小売りのデータでは、どの時期にどれぐらい需要があるかを予測し、欲しい時に欲しい商品を用意することが必要です

時系列とは何か

  • 時系列とは、文字通り一定の間隔で収集される一連のデータポイントのこと
  • 時系列分析の一般的なモデルとして「自己回帰和分移動平均(ARIMA)」「指数平滑法」「三重指数平滑法」などがあります

Alteryx Machine Learing での時系列分析のセットアップ

日時の選択

  • 日時のデータは、時系列分析において最も重要な項目
  • 使用するデータが、時間の経過とともに一定の間隔で発生し、欠損がなく、時刻が正確に表現されいることを確認する必要があります

間隔の選択

  • 間隔については、将来の予測を何回作成するかを指定します

分解する

  • 分解とは、時系列データにどのようなパターンがあるかを確認し、どのような結果が予測されるかを確認します

  • 具体的な3つの分解タスクは、「トレンド」「季節性」「残差」があります。

    • トレンド:単なる直線的なデータではなく、時間の経過で上下するデータ
    • 季節性 :一定の間隔で時間の経過とともに起こる一貫したパターンを含むデータ
    • 残差  :トレンドと季節性の変化を除いたデータ

準備するデータについて

  • Alteryx Machine Learingはデータ準備ツールではないので、Designerなどと連携しながら事前にデータをクリーニングする必要があります
  • また、取り込めるデータは1つのみとなります

Alteryx Machine Learingハンズオン

ここからは、実際にAlteryx Machine Learingを使用してハンズオン形式でモデル構築をしました。ユースケースとしては、自身はビール会社のオーナーであり、変化する需要に合わせて生産ラインを調整するため今後3四半期の需要予測を行うというものを想定して進めていきました

Problem Setup

  • データの取り込み
    • Upload Dataからデータを取り込む
  • 分析対象のデータと分析手法を設定
    • 今回は「Beer」を対象に「Time Series」分析を行う
  • 時系列データと予測期間を設定
    • 「Quarter」の時系列で「3」四半期分の分析を行う

その他機能の紹介

  • Education Modeについて
    • Education Modeをクリックするとウィンドウが開き、画面の内容に関する多くの情報が出てきます
    • 今何をしているのか、内容をどのように解釈するべきかが記載されており、一種のスキルアップに繋がります
  • データプロファイリング
    • データプロファイリングをクリックすると、データの分布を確認できます
    • ここで、データに欠損や問題がないかも確認することができます

Auto Model

  • モデルの選択
    • Leaderboardでは、使用するモデルの選択をします
    • 今回は「ARIMA」モデルを選択

その他機能の紹介

  • Time Series Setup
    • この画面では、時系列分析のセットアップ内容を確認することができます

Evaluate Model

  • モデルの評価
    • この画面ではモデルとデータを比較し、モデルのパフォーマンスを評価します

Export and Predict

  • この画面では、モデルのエクスポートができます
    • Designerにエクスポートして、ワークフローとして利用することも可能
    • ※Alteryx Intelligence Suiteなど追加ツールが必要。詳細は公式ヘルプで確認可能

最後に

いかがでしたでしょうか。私は機械学習モデルを構築するのは初めてでしたので、正直理解が追い付かない部分は多かったのですが、Education Modeなどをうまく活用して勉強していきたいと思います。