【レポート】トレーニングセッション:時系列分析で未来予測〜SEE THE FUTURE – TIME SERIES ANALYSIS〜 – Alteryx Inspire 2019 #alteryx19

Inspire2019のトレーニングセッション、「時系列分析で未来予測」のレポートです。
2019.07.01

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

現地時間2019年06月10日〜2019年06月14日に米国ナッシュビルで開催されているAlteryxの年次カンファレンスイベント「Inspire 2019」。今回クラスメソッドからは計6人のメンバーが現地参加しています。

当エントリではイベント1日目に行われたセッション「時系列分析で未来予測〜SEE THE FUTURE - TIME SERIES ANALYSIS」について、その内容をレポートしたいと思います。

目次


セッション概要

当トレーニングセッションの概要は以下の通りです。

セッションタイトル: SEE THE FUTURE - TIME SERIES ANALYSIS (時系列分析で未来予測)

登壇者: Tony Moses

セッション概要: Have a rich history of data based in time? Use your data to help create future projections and impress your organization using your crystal ball, Alteryx.

(時間に基づいた豊富なデータ履歴をお持ちですか?データを使用して将来を予測し、水晶玉(Alteryx)を使ってあなたの組織を感動させましょう。)

セッションレポート

時系列データから周期性を確認する時系列分析ツールをハンズオン形式で実践的に学ぶトレーニングです。本エントリではハンズオンやエクササイズ以外のレポートをします。

イントロダクション

ステファン・ホーキング氏が自身の著書、『A brief history of time』で「未来を予測(predict)することはできない」と言及しました。確実な未来予測はできませんが近づくことは可能です。当トレーニングではデータを用いた予測(forecast)をします。

時系列データ

時系列データのために必要な要素は以下の通り。

  • 連続した時間間隔を持つ
  • 時間間隔にわたる連続測定
  • 2つの測定値の間隔は一定
  • 時間単位が最大1つのデータポイントを持つ

時系列パターン

時系列データで確認可能な周期性のパターンは以下の通り。 | パターン | 説明 | | -- | -- | | 傾向変動 | 以下の3種類がある ・上昇傾向 ・下降傾向 ・定常(傾向なし) | | 季節変動 | 季節によって変動する (例:シャンパンの売り上げは12月に増える) | | 循環変動 | 期間は一定ではないが、 上下の変動が見られる (例:景気変動は数年続くが、期間は事前にわからない) |

Alteryxの時系列分析ツール

TS Plot Tool(TSプロットツール)

  • TS Plot Toolでは時間と時系列のターゲット変数との間の関係をグラフィック表示させます。横軸は時間、縦軸はターゲット変数の値です。
  • インプットデータ: 時系列データのルールに則ったデータストリーム

TS Plot Toolを使ったサンプルのワークフローはこちら。

ETS Tool(ETSツール)

  • ETS Toolは、指数平滑法を使用して単変量時系列予測モデルを推定します。
  • ETS Toolでは以下3つの時系列要素を表示可能です。
  • レベル
  • 傾向
  • 季節性
  • インプットデータ: 予測する時系列の履歴データを含むデータストリーム

  • 加法(Additive)
  • 傾向・季節性の変動が時間の経過とともに一定に存在している
  • 乗法(Manipulative)
  • 傾向・季節性の変動が時間の経過とともに増えたり減ったりしている
  • 時系列データの分解によって上記を確認可能

ARIMA Tool

  • ARIMA Toolは、自己回帰統合移動平均(またはARIMA)法を使用して、単変量モデルまたは共変量を含むモデル(予測子)として時系列予測モデルを推定します。
  • インプットデータ: 予測される時系列の履歴データ、オプションで共変量のセットを含むデータストリーム
  • ARIMA(p,d,q)
  • Autoregressive(自己回帰)(p):過去の値に対して線形に依存する
  • Integrated(和分)(d):時系列を定常にするために適用される微分変換(平均と分散は時間とともに変化しない)
  • Moving Average(移動平均)(q):誤差値に線形依存する
  • Seasonal ARIMA(p,d,q)(P,D,Q)m
  • m:シーズン内の期間の数
  • 例:年間の季節性は12で表される
  • 共変量とARIMA
  • ARIMAモデルは特別なタイプの回帰モデルの一つとして考えることができる
  • 共変量とはターゲット変数自体の過去の値以外の予測変数
  • 経時的に分散を安定させるためのシンプルでありつつも効果的な方法は、時系列にべき乗変換(平方根​​、立方根、対数など)を適用すること

TS Compare Tool(TS比較ツール)

  • 各モデルのポイント予測と、保持されている一連のデータについて予測されているフィールドの実際の値とを比較するという点で、モデルの精度について一般的に使用される測定基準を提供します。
  • インプットデータ
  • 結合された同じ項目を予測する一連の時系列モデル
  • 時系列モデル(ARIMAまたはETS)による予測値と同じ項目を含み、モデルの作成に使用された期間の直後の期間となるデータストリーム
  • 精度を測る指標
  • Mean Error(ME)
  • Root Mean Square Error (RMSE)
  • Mean Absolute Error (MAE)
  • Mean Percentage Error (MPE)
  • Mean Absolute Percentage Error (MAPE)
  • Mean Absolute Scaled Error (MASE)

TS Forecast Tool(TS予測ツール)

  • ユーザー指定の将来の期間について、ARIMAまたはETSモデルのいずれかから予測を提供します。
  • インプットデータ:ARIMAツールもしくはETSツールより出力されたデータ

  • 設定画面に現れるConfident Interval(信頼区間)とは
  • 信頼区間で設定された確率の範囲内に予測値がおさまる(例えば、95%に設定すると95%の確率で予測値が範囲内におさまる)

TS Covariate Forecast Tool(TS共変量予測ツール)

  • ユーザー指定の将来の期間の共変量を使用して推定されたARIMAモデルからの予測を提供します。
  • インプットデータ
  • ARIMAツールもしくはETSツールより出力されたデータ
  • 関連する(将来の)共変量情報を含むデータストリーム(多くの場合、これらの値は予測値でもあります)

まとめ

時系列分析ひとつ取ってもAlteryxにはこれだけツールがあります。何をどう使えばいいかわからないという状態でも、公式よりサンプルワークフローが提供されていますので、まずは実行してどういう動きをしているのか確認するのもいいかもしれません。時系列分析ツールのサンプルワークフローは以下エントリでご紹介しています。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400