Alteryxの指数平滑法(ETS)使い方や活用例を紹介
Alteryxの「指数平滑法(ETS)」について、主な使い方や活用例を紹介します。
「指数平滑法」とは?
「指数平滑法」はAlteryxの時系列カテゴリにあるツールになります。
「指数平滑法」とは過去の時系列データを基に将来のデータを予測する分析手法です。
特徴として短期間における予測分析に適していると言われています。
Alteryxの「指数平滑法」では予測分析だけでなく、用意した時系列データの傾向も観測できるのが1つの特徴と言えます。
具体的にどういったデータが見れるのかは以下の使い方でご紹介します。
指数平滑法の使い方
ワークフロー
「指数平滑法」の使い方について解説します。
今回以下のワークフローを準備しましたので、これを基にどのように「指数平滑法」が使われるかを解説します。
今回用意したデータはあるホテルの予約数を各年月毎にまとめたものになります。
データの中身は「Year」「Month」「Bookings」の3項目があり、2002年1月~2010年4月までの時系列データが入っています。
この時系列データを基に今後1年間(2011年4月まで)の予約数推移を予測分析してみます。
まずフィルターで2010年1月~4月のデータを除外します。
除外する理由としては2010年は1年分のデータがないため、2002年~2009年までの時系列データと同じように取り扱うことができません。
そのためここでフィルターを使い、2002年~2009年までの時系列データのみを残すようにします。
フィルターで絞った2002年~2009年までの時系列データに「指数平滑法」をつなげます。
指数平滑法では以下の設定をします。
指数平滑法の設定
各項目について以下補足説明です。
必須パラメーター
モデル名では今回予測分析で表示される名前をつけることができます。
ターゲットフィールドでは予測分析したいフィールドを指定します。
注意点として数字型のデータである必要があります。
今回は予約数の予測分析なので「Bookings」を指定します。
ターゲットフィールドは今回の時系列データが各月毎のデータなので「毎月」を指定します。
予測分析のモデルタイプを設定できます。
デフォルトだと「自動」が選択されます。
一般的には季節要因の影響が大きいデータは「乗法」、季節要因の影響が少ないデータは「加法」のモデルが適切だそうです。
各項目において個別設定することもできますが、基本的にはAlteryx側で自動で判別する選択で問題ないかと思います。
機械学習における情報量基準や予測分析をする期間の設定などができます。
「情報量基準」や「Box-Cox変換」に関する説明は複雑なので、ここでは割愛します。
今回は2002年1月から始まるデータなのでシリーズ開始期間を設定。
2011年4月までのデータを見たいので予測プロットに含める期間の数を16にします。
(2010年1月~2011年4月までの月数)
表示されるグラフィックの設定ができます。
今回はデフォルトのままで使います。
閲覧ツールで出力
今回の予測分析結果がどのように出力されるか確認してみます。
「指数平滑法」には「O」「R」「I」の3つの出力があります。
今回設定したモデル名とデータのサイズが表示されます。
この「O」に「時系列予測」をつなげることで、さらに予測の精度に応じた範囲やテーブル形式でのデータが可視化できます。
「R」の出力
時系列データを「observed(観察)」「level(レベル)」「slope(傾き)」「season(季節)」の構成で分解してグラフ化します。
最大4つの構成ですがデータによっては出力される構成が減るケースもあります。
「I」の出力
分析したデータをHTMLダッシュボードでグラフ化して表示します。
「R」の出力と違いグラフを拡大できたり、実際の数値が見れるようになります。
2011年4月の予測データは適合値が13231で、下限7869上限18593の範囲に収まる予想だということがわかりました。
指数平滑法の活用例
こちらでは実際に「指数平滑法」を使ってどのようなことができたかの検証記事を紹介します。
企業の売上、社員数を予測
まとめ
以上Alteryxの「指数平滑法(ETS)」について主な使い方や活用例の紹介でした。
予測分析が使えると、分析から仮説検証までのプロセスを効率的に進めることができます。
まだ活用していないAlteryx利用者はぜひ使ってみましょう。