定常性についてのまとめ

データ分析

#統計

#データ分析

#時系列データ分析

masuwo3

2016.07.07

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

当記事は、沖本竜義先生の著作である「経済・ファイナンスデータの計量時系列分析(朝倉書店)」の内容をもとに、データ分析の前提となる基礎的な部分に関して、要点や定義などをまとめた覚え書きです。

あくまで覚え書き程度の内容ですので、当記事を読まれて、より詳細な内容を知りたいと思われた方は、上記の著書を入手頂ければと思います。

時系列モデル

時系列分析の問題点として、観測可能なデータがその時点で一度しか観測できないという問題があります。

時系列分析の対象となる株価を例にあげると、日経平均株価の昨日の終値を一度だけ観測することはできますが、当然その終値の平均的な値、つまり期待値を一点の観測データから推定することはできません。
また、将来の予測を行おうとする場合は、将来の観測点が得られないため、存在しない値と過去の値との自己相関を評価する必要があります。このため、将来の値を含めて予測を行うためには、(y_t)自身になんらかの構造を仮定して、その構造を用いて予測を行う必要があります。

時系列分析では、観測された時系列データをある確率変数列からの一つの実現値とみなします。
この確率変数列のことを確率過程(stochastic process)もしくはデータ生成過程(DGP; data generating process)と呼び、時系列分析ではこの確率過程の構造のことを時系列モデルと呼びます。

定常性

様々な時系列モデルの根幹となる概念に、定常性(stationarity)があります。
定常性は、時間や位置によってその確率分布が変化しないという確率過程の性質を表します。

定常性は、その不変性の範囲によって、弱定常性(weak stationarity)と強定常性(strict stationarity)の2つに分類されます。

弱定常性

弱定常性とは、過程の期待値と自己共分散が時間を通じて常に一定であることを指します。

定義 1.1 (弱定常性) 任意のtとkに対して、

[latex]E(y_t) = \mu[/latex] [latex]Cov(y_t,y_t-k) = E[(y_t - \mu)(y_{t-k} - \mu)] = \gamma_k[/latex]

が成立する場合、過程は弱定常性(weak stationary)といわれる。

上記の定義からわかるように、弱定常性をもつ確率過程においては、自己共分散は時点については依存せず、時間差kに対してのみ依存していることがわかります。

弱定常性が時点に依存しないことから、自己相関について以下の式を導くことができます。

[latex] Corr(y_t,y_{t-k}) = \frac{\gamma_{kt}}{\sqrt{\gamma_{0t}\gamma_{0,t-k}}}= \frac{\gamma_k}{\gamma_0} = \rho_k [/latex]

すなわち、自己相関も時点に依存しなくなることがわかります。

強定常性

強定常性は、任意の時点、時間差に対して常に同一の同時分布をもつことを指します。

定義 1.2 (強定常性) 任意のtとkに対して、\((y_t,y_{t+1},...,y_{t+k})'\)の同時分布が同一となる場合、過程は強定常性(strict stationary)といわれる。ここで、\(\bf y'\)はベクトル\(\bf y\)の転置を表す。

弱定常性が、自己相関についてのみ時差kに対して依存構造をもつのに対し、強定常性では全ての構造について時差kに依存するという性質を持っています。

iid系列とホワイトノイズ

上記の定常性を持った最も基礎的な定常過程の例として、iid系列とホワイトノイズがあります。

iid系列

強定常性を持った定常過程の代表的な例として、次のiid系列があります。

定義1.3 (iid系列) 書く時点のデータが互いに独立でかつ同一の分布に従う系列はiid系列(iid sequence)と呼ばれる。

iidとは、independently and identically distributedの略です。

iidを表記する際は、期待値\(\mu\),分散\(\gamma^2\)のiidである場合、以下のように記述します。

[latex] y_t \sim iid(\mu, \sigma^2) [/latex]

iid系列自体は、非常に定常性が強いため、そのままファイナンスデータなどの時系列モデルとして用いられることは多くありませんが、期待値0のiid系列は時系列モデルの確率的変動部分を表現する部分として用いられることがあります。これを撹乱項(innovation, disturbance term)と呼びます。

一方で、iid系列はそれ単体では独立性や同一分布性が強く、必ずしも分析に必要となるものではありません。もう少し弱い仮定しか必要とせず、モデルの撹乱項として適切な定常性過程が必要となる場合があります。それが以下で説明するホワイトノイズです。

ホワイトノイズ

ホワイトノイズは、以下の定義に基づいた弱定常性を持ちます。

定義1.4(ホワイトノイズ) すべての時点tにおいて [latex]E(\epsilon_t) = 0[/latex] [latex] \gamma_k = E(\epsilon_t \epsilon_{t-k}) = \begin{cases} \sigma^2 & k = 0 \\ 0 & k \neq 0 \end{cases} [/latex] が成立するとき、\(\epsilon_t\)はホワイトノイズ(white noise)と呼ばれる。

分散が\(\gamma^2\)のホワイトノイズのことを、以下のように表記します。

[latex] \epsilon_t \sim W.N.(\sigma^2) [/latex]

ホワイトノイズは、すべての時点において期待値が0であり、分散が常に一定であり、かつ自己相関を持たないという性質をもちます。これらのことから、ホワイトノイズは弱定常性を持つことがわかります。

基礎的な弱定常過程は、ホワイトノイズを用いて

[latex] y_t = \mu + \epsilon_t, \epsilon_t \sim W.N.(\sigma^2) [/latex]

として表現することができます。

このように、基本的な弱定常過程については、ホワイトノイズを用いて表現することが可能となります。

ただし、弱定常過程に該当する時系列データは一部のものであり、実際に時系列データを分析しようとした際には自己相関や条件付き分散の変動を考慮したより一般的なモデルが必要となります。

参考

「経済・ファイナンスデータの計量時系列分析」(朝倉書店)
Stationary process - Wikipedia, the free encyclopedia

定常性についてのまとめ

はじめに

時系列モデル

定常性

弱定常性

強定常性

iid系列とホワイトノイズ

iid系列

ホワイトノイズ

参考

関連記事

主なカテゴリ

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

お問い合わせ

運営会社