AlteryxのARIMA使い方や活用例を紹介

Alteryxのツール「ARIMA」を解説します。
2024.03.14

Alteryxの「ARIMA」について、主な使い方や活用例を紹介します。

「ARIMA」とは?

「ARIMA」はAlteryxの時系列カテゴリにあるツールになります。
Alteryx_ets_1

「ARIMA」とは時系列分析のモデルです。
自己回帰和分移動平均モデルとも入れており、自己回帰(AR)、移動平均(MA)、差分(I)を組み合わせたものになります。

特徴としてトレンドがあるデータや自己相関を持つデータの予測分析には強いですが、過去データが少ない場合は予測が困難になります。
実際にAlteryxで「ARIMA」を使って、どういう予測分析ができるのか、サンプルデータを元に使い方を説明します。

ARIMAの使い方

ワークフロー

「ARIMA」の使い方について解説します。
今回以下のワークフローを準備しましたので、これを基にどのように「ARIMA」が使われるかを解説します。
Alteryx_arima2

今回用意したデータはあるホテルの予約数を各年月毎にまとめたものになります。
データの中身は「Year」「Month」「Bookings」の3項目があり、2002年1月~2010年4月までの時系列データが入っています。
Alteryx_ets_3

この時系列データを基に1年間の予約数推移を予測分析してみます。
まずフィルターで2010年1月~4月のデータを除外します。
Alteryx_ets_4

除外する理由としては12か月分ある年までにしておいたが実測値との乖離が少なかったので2009年までの時系列データのみを残すようにします。
Alteryx_ets_5

フィルターで絞った時系列データに「ARIMA」をつなげます。
Alteryx_arima3

ARIMAでは以下の設定をします。

ARIMAの設定

必須パラメーター

Alteryx_arima4

モデル名

今回予測分析で表示される名前をつけることができます。

ターゲットフィールド

予測分析したいフィールドを指定します。
注意点として数字型のデータである必要があります。
今回は予約数の予測分析なので「Bookings」を指定します。

モデル推定に共変量を使用しますか?

共変量とは「結果と共に変わる変数」をいいます。
共変量に値するフィールドがあればここで選択することができます。
今回は共変量はないのでチェックを外します。

ターゲットフィールドの頻度

今回の時系列データが各月毎のデータなので「毎月」を指定します。

モデルのカスタマイズ

Alteryx_arima4_2

任意ですが分析モデルのパラーメーターをカスタマイズすることもできます。
デフォルトだと自動で行われるので、細かい設定が必要ない場合はチェックなしのままでOKです。
今回はチェックなしで行いますが、各チェックを入れるとどういったことが設定できるかを以下お見せしておきます。

自動モデル作成に使用されるパラーメータをカスタマイズする場合

Alteryx_arima5

完全ユーザー指定モデルでカスタマイズする場合

Alteryx_arima6

その他のオプション

Alteryx_arima7

シリーズ開始期間

データ対象の起点となる数字がある場合、チェックを入れます。
今回は2002年1月から始まるデータなのでシリーズ開始期間を設定。
2010年までの1年間を予測したデータを見たいので予測プロットに含める期間の数を12にします。
(2010年1月~2010年12月までの月数)

グラフィックオプション

Alteryx_arima8

表示されるグラフィックの設定ができます。
今回はデフォルトのままで使います。

閲覧ツールで出力

Alteryx_arima9

今回の予測分析結果がどのように出力されるか確認してみます。
「ARIMA」には「O」「R」「I」の3つの出力があります。

「O」の出力

今回設定したモデル名とデータのサイズが表示されます。
Alteryx_arima10

この「O」に以下の「時系列予測」をつなげることで、さらに予測の精度に応じた範囲やテーブル形式でのデータが可視化できます。
TS_Forecast

「R」の出力

今回分析した要約が出力されます。
Alteryx_arima11
Alteryx_arima12

1つの見方として自己相関関数プロットのところを見て、青い点線の部分を大きく超える部分が複数あったら[モデルのカスタマイズ]でパラメーターを再設定し、予測の精度を上げるという調整のやり方もあります。

「I」の出力

分析したデータをHTMLダッシュボードでグラフ化して表示します。
Alteryx_arima13
Alteryx_arima14

「R」の出力と違いグラフを拡大できたり、実際の数値が見れるようになります。
例として見せると2010年8月の予測データは適合値が17643で、下限15489上限19797の範囲に収まる予想だということがわかりました。
Alteryx_arima15

ARIMAの活用例

こちらでは実際に「ARIMA」を使ってどのようなことができたかの検証記事を紹介します。

企業の売上、社員数を予測

まとめ

以上Alteryxの「ARIMA」について主な使い方や活用例の紹介でした。
Alteryxの時系列分析には「ARIMA」以外にも「ETS(指数平滑法)」のツールもあります。

どちらのツールを使うがいいかは、その時に使うデータによって異なってくるため、Alteryxでは「モデル比較」で比べてみて判断するというやり方もあります。
以下の記事はモデル比較の自動判定のワークフローを紹介してますので、気になる方は見てちょ!