【レポート】トレーニングセッション:Alteryxの時系列モデリングによって未来を予測する #alteryx23
こんにちは!アライアンス統括部のikumiです。現地時間2023年05月22日(月)〜2023年05月25日(木)に米国ラスベガスで開催されたAlteryxの年次カンファレンスイベント「Inspire 2023」。今回クラスメソッドからは計6人のメンバーが現地参戦してきました。
本記事では、5/23に行われた「Alteryxの時系列モデリングによって未来を予測する」について、その内容をお届けいたします。
セッション概要
- セッションタイトル
- See the Future: Time Series Modeling with Alteryx Machine Learning
- スピーカー(敬称略)
- Pier Bobys, Sr. Solutions Advisor, Alteryx
- 概要
- 過去の観測に基づいて、未来の行動を予測する方法を学びます。これは時間ベースのデータを扱う場合に特に役立つ分析手法となります。
セッション内容
本日学ぶ内容
このセッションでは、以下の内容を学んでいきました。
- 時系列分析の基本概念
- 時系列分析を行うにあたって必要なフィールド
- Alteryxでの時系列分析のモデル構築
身近にある時系列データの例
- 経済や金融のデータ、天気のデータ、医療データなど、これらは身近にある時系列データの一例です
- 例えば小売りのデータでは、どの時期にどれぐらい需要があるかを予測し、欲しい時に欲しい商品を用意することが必要です
時系列とは何か
- 時系列とは、文字通り一定の間隔で収集される一連のデータポイントのこと
- 時系列分析の一般的なモデルとして「自己回帰和分移動平均(ARIMA)」「指数平滑法」「三重指数平滑法」などがあります
Alteryx Machine Learing での時系列分析のセットアップ
日時の選択
- 日時のデータは、時系列分析において最も重要な項目
- 使用するデータが、時間の経過とともに一定の間隔で発生し、欠損がなく、時刻が正確に表現されいることを確認する必要があります
間隔の選択
- 間隔については、将来の予測を何回作成するかを指定します
分解する
- 分解とは、時系列データにどのようなパターンがあるかを確認し、どのような結果が予測されるかを確認します
-
具体的な3つの分解タスクは、「トレンド」「季節性」「残差」があります。
- トレンド:単なる直線的なデータではなく、時間の経過で上下するデータ
- 季節性 :一定の間隔で時間の経過とともに起こる一貫したパターンを含むデータ
- 残差 :トレンドと季節性の変化を除いたデータ
準備するデータについて
- Alteryx Machine Learingはデータ準備ツールではないので、Designerなどと連携しながら事前にデータをクリーニングする必要があります
- また、取り込めるデータは1つのみとなります
Alteryx Machine Learingハンズオン
ここからは、実際にAlteryx Machine Learingを使用してハンズオン形式でモデル構築をしました。ユースケースとしては、自身はビール会社のオーナーであり、変化する需要に合わせて生産ラインを調整するため今後3四半期の需要予測を行うというものを想定して進めていきました
Problem Setup
- データの取り込み
- Upload Dataからデータを取り込む
- Upload Dataからデータを取り込む
- 分析対象のデータと分析手法を設定
- 今回は「Beer」を対象に「Time Series」分析を行う
- 今回は「Beer」を対象に「Time Series」分析を行う
- 時系列データと予測期間を設定
- 「Quarter」の時系列で「3」四半期分の分析を行う
- 「Quarter」の時系列で「3」四半期分の分析を行う
その他機能の紹介
- Education Modeについて
- Education Modeをクリックするとウィンドウが開き、画面の内容に関する多くの情報が出てきます
- 今何をしているのか、内容をどのように解釈するべきかが記載されており、一種のスキルアップに繋がります
- データプロファイリング
- データプロファイリングをクリックすると、データの分布を確認できます
- ここで、データに欠損や問題がないかも確認することができます
Auto Model
- モデルの選択
- Leaderboardでは、使用するモデルの選択をします
- 今回は「ARIMA」モデルを選択
その他機能の紹介
- Time Series Setup
- この画面では、時系列分析のセットアップ内容を確認することができます
- この画面では、時系列分析のセットアップ内容を確認することができます
Evaluate Model
- モデルの評価
- この画面ではモデルとデータを比較し、モデルのパフォーマンスを評価します
- この画面ではモデルとデータを比較し、モデルのパフォーマンスを評価します
Export and Predict
- この画面では、モデルのエクスポートができます
- Designerにエクスポートして、ワークフローとして利用することも可能
- ※Alteryx Intelligence Suiteなど追加ツールが必要。詳細は公式ヘルプで確認可能
最後に
いかがでしたでしょうか。私は機械学習モデルを構築するのは初めてでしたので、正直理解が追い付かない部分は多かったのですが、Education Modeなどをうまく活用して勉強していきたいと思います。