2023-01-16

時系列分析メモ:差分方程式(1)

時系列分析

・本稿の内容
時系列分析で使用する差分方程式のメモです。今回は定数項と誤差項をもつ1次の差分方程式

$y_{t}=a_{0}+a_{1}y_{t-1}+\varepsilon_{t}$

において、逐次的に代入を行う形で解を求める方法を確認していきます。本稿の内容の多くは、ウォルター・エンダース著,新谷元嗣・薮友良訳 (2019)『実証のための計量時系列分析』有斐閣の第1章に基づいています。
・本文

Ⅰ:収束系列
- Ⅰ-1:初期値が与えられている場合
- Ⅰ-2:初期値が与えられていない場合
Ⅱ:非収束系列

Ⅰ:収束系列

※Ⅰ-1、Ⅰ-2では $|a_{1}|<1$ の場合を考えることにする。

Ⅰ-1:初期値が与えられている場合

以下の1次の差分方程式を解く。

$y_{t}=a_{0}+a_{1}y_{t-1}+\varepsilon_{t}・・・①$

初期条件 $y_{0}$ が与えられているとする。 $y_{1}$ は

$y_{1}=a_{0}+a_{1}y_{0}+\varepsilon_{1}$

となる。
$y_{2}$ は

$\begin{eqnarray} y_{2}&=&a_{0}+a_{1}y_{1}+\varepsilon_{2}\\ &=&a_{0}+a_{1}(a_{0}+a_{1}y_{0}+\varepsilon_{1})+\varepsilon_{2}\\ &=&a_{0}(1+a_{1})+a_{1}^{2}y_{0}+(\varepsilon_{2}+a_{1}\varepsilon_{1}) \end{eqnarray}$

となる。

$y_{3}$ は

$\begin{eqnarray} y_{3}&=&a_{0}+a_{1}y_{2}+\varepsilon_{3}\\ &=&a_{0}+a_{1}[a_{0}(1+a_{1})+a_{1}^{2}y_{0}+(\varepsilon_{2}+a_{1}\varepsilon_{1})]+\varepsilon_{3}\\ &=&a_{0}(1+a_{1}+a_{1}^{2})+a_{1}^{3}y_{0}+(\varepsilon_{3}+a_{1}\varepsilon_{2}+a_{1}^{2}\varepsilon_{1}) \end{eqnarray}$

となる。以下、同様に前向きに代入を繰り返していく。

$y_{t}(t>0)$ は

$\begin{eqnarray} y_{t}&=&a_{0}(1+a_{1}+a_{1}^{2}+\cdots+a_{1}^{t-1})+a_{1}^{t}y_{0}+(\varepsilon_{t}+a_{1}\varepsilon_{t-1}+\cdots+a_{1}^{t-2}\varepsilon_{2}+a_{1}^{t-1}\varepsilon_{1})\\ &=&a_{0}\sum\limits_{i=0}^{t-1} a_{1}^{i}+a_{1}^{t}y_{0}+\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i}・・・② \end{eqnarray}$

となる。②式は時間 $t$ と誤差項の系列 $\{\varepsilon_{t}\}$ 、初期値 $y_{0}$ の関数となっている。②式が①式の解であることを確認してみる。

①式に②式を代入する。

$a_{0}\sum\limits_{i=0}^{t-1} a_{1}^{i}+a_{1}^{t}y_{0}+\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i}=a_{0}+a_{1}\left[a_{0}\sum\limits_{i=0}^{t-2} a_{1}^{i}+a_{1}^{t-1}y_{0}+\sum\limits_{i=0}^{t-2} a_{1}^{i}\varepsilon_{t-i-1}\right]+\varepsilon_{t}・・・③$

③式の右辺の[]の中の項を見ていく。 $a_{0}\sum\limits_{i=0}^{t-2} a_{1}^{i}$ は

$a_{0}\sum\limits_{i=0}^{t-2} a_{1}^{i}=a_{0}(1+a_{1}+a_{1}^{2}+\cdots+a_{1}^{t-2})$

である。両辺に $a_{1}$ をかけると

$a_{1}a_{0}\sum\limits_{i=0}^{t-2} a_{1}^{i}=a_{0}(a_{1}+a_{1}^{2}+\cdots+a_{1}^{t-2}+a_{1}^{t-1})$

である。両辺に $a_{0}$ を足すと

$\begin{eqnarray} a_{0}+a_{1}a_{0}\sum\limits_{i=0}^{t-2} a_{1}^{i}&=&a_{0}(1+a_{1}+a_{1}^{2}+\cdots+a_{1}^{t-1})\\ &=&a_{0}\sum\limits_{i=0}^{t-1} a_{1}^{i} \end{eqnarray}$

である。
$\sum\limits_{i=0}^{t-2} a_{1}^{i}\varepsilon_{t-i-1}$ は

$\sum\limits_{i=0}^{t-2} a_{1}^{i}\varepsilon_{t-i-1}=\varepsilon_{t-1}+a_{1}\varepsilon_{t-2}+\cdots+a_{1}^{t-2}\varepsilon_{1}$

である。両辺に $a_{1}$ をかけると

$\begin{eqnarray} a_{1}\sum\limits_{i=0}^{t-2} a_{1}^{i}\varepsilon_{t-i-1}&=&a_{1}\varepsilon_{t-1}+a_{1}^{2}\varepsilon_{t-2}+\cdots+a_{1}^{t-2}\varepsilon_{2}+a_{1}^{t-1}\varepsilon_{1} \end{eqnarray}$

である。両辺に $\varepsilon_{t}$ を足すと

$\begin{eqnarray} \varepsilon_{t}+a_{1}\sum\limits_{i=0}^{t-2} a_{1}^{i}\varepsilon_{t-i-1}&=&\varepsilon_{t}+a_{1}\varepsilon_{t-1}+a_{1}^{2}\varepsilon_{t-2}+\cdots+a_{1}^{t-2}\varepsilon_{2}+a_{1}^{t-1}\varepsilon_{1}\\ &=&\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i} \end{eqnarray}$

である。

$a_{1}^{t-1}y_{0}$ に $a_{1}$ をかけると $a_{1}^{t}y_{0}$ である。

よって、③式の左辺と右辺が等しくなるため、②式は①式の解であることが確認できた。

Ⅰ-2:初期値が与えられていない場合

②式を再掲する。

$\begin{eqnarray} y_{t}=a_{0}\sum\limits_{i=0}^{t-1} a_{1}^{i}+a_{1}^{t}y_{0}+\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i}・・・② \end{eqnarray}$

初期値が与えられていない場合は $y_{0}$ に $a_{0}+a_{1}y_{-1}+\varepsilon_{0}$ を代入し、計算を続ける。

$\begin{eqnarray} y_{t}&=&a_{0}\sum\limits_{i=0}^{t-1} a_{1}^{i}+a_{1}^{t}(a_{0}+a_{1}y_{-1}+\varepsilon_{0})+\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i}\\ &=&a_{0}\sum\limits_{i=0}^{t} a_{1}^{i}+a_{1}^{t+1}y_{-1}+\sum\limits_{i=0}^{t} a_{1}^{i}\varepsilon_{t-i} \end{eqnarray}$

さらに後ろ向きに $m$ 期分代入を繰り返すと、

$y_{t}=a_{0}\sum\limits_{i=0}^{t+m} a_{1}^{i}+a_{1}^{t+m+1}y_{-m-1}+\sum\limits_{i=0}^{t+m} a_{1}^{i}\varepsilon_{t-i}・・・④$

となる。

$|a_{1}|<1$ の場合、 $m$ が $\infty$ に近づいていくとき、④式の $\sum\limits_{i=0}^{t+m} a_{1}^{i}$ の部分は $\dfrac{1}{1-a_{1}}$ に収束し、 $a_{1}^{t+m+1}$ は0に収束する。

よって、

$y_{t}=\dfrac{a_{0}}{1-a_{1}}+\sum\limits_{i=0}^{\infty} a_{1}^{i}\varepsilon_{t-i}・・・⑤$

となる。⑤式は誤差項の系列 $\{\varepsilon_{t}\}$ の関数となっている。⑤式が①式の解であることは②式が①式の解であることを確認した時と同様の方法で確認できる。(計算は省略)

⑤式は一意な解ではなく、右辺に $Aa_{1}^{t}(Aは任意の定数)$ を加えた、

$y_{t}=Aa_{1}^{t}+\dfrac{a_{0}}{1-a_{1}}+\sum\limits_{i=0}^{\infty} a_{1}^{i}\varepsilon_{t-i}\\・・・⑥$

も解であることが確認できる。(②式が①式の解であることを確認した時と同様の方法で確認できる。計算は省略。)

Ⅱ:非収束系列

ここでは初期値 $y_0$ が与えられている場合を考える。
①式の係数 $a_{1}$ が1のとき、②式は

$y_{t}=a_{0}t+y_{0}+\sum\limits_{i=0}^{t-1} \varepsilon_{t-i}・・・⑦$

である。ここで②式の $\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i} (|a_{1}|<1)$ と⑦式の $\sum\limits_{i=0}^{t-1} \varepsilon_{t-i}$ を比較してみる。

$\sum\limits_{i=0}^{t-1} a_{1}^{i}\varepsilon_{t-i}=\varepsilon_{t}+a_{1}\varepsilon_{t-1}+a_{1}^{2}\varepsilon_{t-2}+\cdots・・・⑧\\ \sum\limits_{i=0}^{t-1} \varepsilon_{t-i}=\varepsilon_{t}+\varepsilon_{t-1}+\varepsilon_{t-2}+\cdots・・・⑨$

⑦式は過去の $\varepsilon_{}$ が現在の $y_{t}$ に与える影響は過去に遡るほど小さくなっていくことを示している。
⑧式は過去の $\varepsilon_{}$ が現在の $y_{t}$ に与える影響は時間の経過とともに小さくならず、恒久的な影響を及ぼすことを示している。

・参考文献
ウォルター・エンダース著,新谷元嗣・薮友良訳 (2019)『実証のための計量時系列分析』有斐閣

2022-08-20

計量経済学メモ:ボックス=ジェンキンスのモデル選択法、R

計量経済学時系列分析 R

・本稿の内容
ボックスジェンキンスの時系列モデル選択法に関するメモです。最初にモデル選択法のプロセスを簡単に確認したあとに、Enders[2014](新谷・藪訳[2019])の練習問題とRを用いて、実際にモデル選択を実施してみます。

・本文

Ⅰ:ボックス=ジェンキンスのモデル選択法の流れ
Ⅱ:Rでボックス=ジェンキンスのモデル選択法を実践

Ⅰ:ボックス=ジェンキンスのモデル選択法の流れ

以下の3段階でモデルを選択する。

1.童貞同定
対象の時系列データを可視化し、自己相関(以下、 $ACF$ )と偏自己相関(以下、 $PACF$ )を確認する。理論上の $ACF$ 、 $PACF$ と比較し、推定するモデルの候補を決める。

2.推定
候補に挙がったモデルを推定し、データの当てはまりや、係数の推定値を分析する。定常で当てはまりが良く、倹約的なモデルを選択する。

3.診断
推定したモデルの残差がホワイトノイズであるどうかを調べる。ホワイトノイズであれば、推定したモデルは適切なモデルとみなすことができる。*1

Ⅱ:Rでボックス=ジェンキンスのモデル選択法を実践

新谷・藪訳[2019]の第2章の練習問題問11を例にボックス=ジェンキンスのモデル選択法を実践していく。*2

以下で使用するデータはここにアップされているSIM2.XLSの系列 $y3$ である。
$y3$ は

$y_t = 0.7y_{t-1}-0.49y_{t-2}+\varepsilon_{t}$

から発生させたものである。

・問11の(a)

以下のコードを実行し、y3系列をグラフ化する。

#使用するライブラリ
library("tidyverse")
library("rugarch")

#データ読み込み
data <- read.xls("C:/Users/81803/Desktop/SIM2.xls")

#y3系列を抽出
Y3 <- data[,"y3"]

#tidyverseのggplotでグラフを作成
data%>%
  ggplot()+
  geom_line(aes(x = X,y= y3))+
  labs(title = "y3系列")+
  theme(
    plot.title    = element_text(hjust = 0.5),   
  )

図1; $y3$ 系列のグラフ

図1をみると、平均と分散がおおむね安定しているように見える。*3
次に以下のコードを実行し、 $ACF$ と $PACF$ を求める。

#ACF,PACF
acf.Y3 <- acf(Y3,lag.max=20,tck=.02,xlab="",ylab="",main="")
acf.Y3
pacf.Y3 <- pacf(Y3,lag.max=20,tck=.02,xlab="",ylab="",main="")
pacf.Y3

図2:ACF

図3:PACF

$AR(2)$ の理論上の $ACF$ は0に減衰し*4、理論上の $PACF$ は3次以上で0となる。図2を見ると、 $ACF$ は振動しながら0に収束しているように見える。図3を見ると3次以上でほぼ0であり、 $AR(2)$ モデルが候補のモデルとして考えられる。

・問11の(b)

ここでは、(a)の結果、 $AR(1)$ モデルを推定するべきだと判断したとして、 $AR(1)$ モデルを推定し、そのモデルを診断してみる。
以下のコードを実行し、 $AR(1)$ モデルを推定する。

#AR(1)モデルを推定
spec.ar1 <- arfimaspec(mean.model = list(armaOrder=c(1,0),include.mean=FALSE))
fit.ar1 <- arfimafit(spec=spec.ar1,data=Y3)
fit.ar1

実行結果の一部を以下に抜粋する。

図4:推定結果

実行結果より、推定されたモデルは

$y_t = \underset{(5.29)}{0.467}y_{t-1}+e_{t}$

である。※()は $t$ 値。図4には記載されていないが、 $AIC$ (赤池情報量基準)の値は0.695である。

次に残差の診断を行うために、以下のコードを実行する。

#リュン=ボックス検定
res.ar1 <- fit.ar1@fit$residuals
Box.test(res.ar1,lag=1,type="Ljung-Box")
Box.test(res.ar1,lag=2,type="Ljung-Box")
Box.test(res.ar1,lag=3,type="Ljung-Box")
#以下、適当なラグ次数まで同様に実施。

実行結果は以下である。

図5:リュン=ボックス検定の結果

図5を見るとすべてのラグ次数でQ統計量の値(X-squared)が大きい(つまり、 $p$ 値が小さい。)ため、「残差に自己相関が無い」という帰無仮説を棄却できる。よって、系列相関が存在する可能性があるため、 $AR(1)$ モデルは不適切なモデルであると判断できる。*5

・問11の(c)

問11の(b)で実施したことを $ARMA(1,1)$ で同様に実施する。本稿では省略するが、 $ARMA(1,1)$ も $AR(1)$ と同様に不適切なモデルであることが確認できる。

・問11の(d)
ここでは、(a)の結果、 $AR(2)$ モデルを推定するべきだと判断したとして、 $AR(2)$ モデルを推定し、そのモデルを診断してみる。
以下のコードを実行し、 $AR(2)$ モデルを推定する。

#AR(2)モデルを推定
spec.ar2 <- arfimaspec(mean.model = list(armaOrder=c(2,0),include.mean=FALSE))
fit.ar2 <- arfimafit(spec=spec.ar2,data=Y3)
fit.ar2

実行結果の一部を以下に抜粋する。

図6:推定結果

実行結果より、推定されたモデルは

$y_t = \underset{(7.88)}{0.692}y_{t-1}\underset{(-5.47)}{-0.48}y_{t-2}+e_{t}$

である。※()は $t$ 値。図6には記載されていないが、 $AIC$ (赤池情報量基準)の値は0.454である。
推定された係数を見ると、真のデータ生成過程である

$y_t = 0.7y_{t-1}-0.49y_{t-2}+\varepsilon_{t}$

の係数とほぼ同じ値になっている。さらに、AICの値が問11(b)で推定した $AR(1)$ モデルよりも小さくなっており、データのあてはまりも改善していると言える。*6

次に残差の診断を行うために、以下のコードを実行する。

#リュン=ボックス検定
res.ar2 <- fit.ar2@fit$residuals
Box.test(res.ar2,lag=1,type="Ljung-Box")
Box.test(res.ar2,lag=2,type="Ljung-Box")
Box.test(res.ar2,lag=3,type="Ljung-Box")
#以下、適当なラグ次数まで同様に実施。

実行結果は以下である。

図7:リュン=ボックス検定の結果

図7を見るとすべてのラグ次数でQ統計量の値(X-squared)が小さい(つまり、 $p$ 値が大きい。)ため、「残差に自己相関が無い」という帰無仮説を棄却できない。よって、系列相関が存在するとは言えず、 $AR(2)$ モデルは適切なモデルであると判断できる。

・参考文献
ウォルター・エンダース著,新谷元嗣・薮友良訳 (2019)『実証のための計量時系列分析』有斐閣

・参考サイト
ウォルター・エンダース著,新谷元嗣・薮友良訳 (2019)のサポートページwww.fbc.keio.ac.jp
David Gabauer氏のホームページsites.google.com
パッケージ「rugarch」のドキュメント
https://cran.r-project.org/web/packages/rugarch/rugarch.pdf

*1:推定したモデルの残差に自己相関[系列相関]が残っているなら、その自己相関を説明できるより良いモデルが存在するという意味です。

*2:問題文の全文掲載は怒られそうなので控えます・・・

*3:本来は異常値や構造変化が生じている可能性、変数が非定常過程である可能性などをしかるべき方法でチェックするべきですが、本稿では省略します。

*4: $y_t = 0.7y_{t-1}-0.49y_{t-2}+\varepsilon_{t}$ の場合は振動しながら0に収束します。詳しくは新谷・藪訳[2019]のP68～71を参照してください。

*5:図5にはラグ次数が3次までの結果しか掲載していませんが、より長いラグ次数でもQ統計量が大きく、p値が小さくなります。ラグ次数20まで確認しています。

*6:決定係数 $R^2$ は説明変数を増やすと常に改善するという欠点があるため、倹約的なモデル選択という観点から、AICなどの情報量基準をデータの当てはまりの良さの基準として用います。

2022-03-27

計量経済学メモ:VAR・識別の基礎　その2

経済学計量経済学

・本稿の内容

前回は2変量VARを例にコレスキー分解を用いた識別制約を確認しました。
本稿では2変量をn変量に一般化して識別に必要な制約条件の個数を再度確認し、*1コレスキー分解以外の識別制約に関して簡単に触れます。

・本文

Ⅰ:識別制約の個数
Ⅱ:識別制約の種類

Ⅰ:識別制約の個数

以下のn変量、1次の構造VARモデルを考える。

$\begin{pmatrix} 1 & b_{12}&\cdots&b_{1n}\\ b_{21}& 1&\cdots&b_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ b_{n1}&b_{n2}&\cdots&1\\ \end{pmatrix} \begin{pmatrix} x_{1t}\\ x_{2t}\\ \vdots\\ x_{nt}\\ \end{pmatrix} = \begin{pmatrix} b_{10}\\ b_{20}\\ \vdots\\ x_{n0}\\ \end{pmatrix} + \begin{pmatrix} \gamma_{11} & \gamma_{12}&\cdots&\gamma_{1n}\\ \gamma_{21}& \gamma_{22}&\cdots&\gamma_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ \gamma_{n1}&\gamma_{n2}&\cdots&\gamma_{nn}\\ \end{pmatrix} \begin{pmatrix} x_{1t-1}\\ x_{2t-1}\\ \vdots\\ x_{nt-1}\\ \end{pmatrix} + \begin{pmatrix} \varepsilon_{1t}\\ \varepsilon_{2t}\\ \vdots\\ \varepsilon_{nt}\\ \end{pmatrix}$

ここで、

$B=\begin{pmatrix} 1 & b_{12}&\cdots&b_{1n}\\ b_{21}& 1&\cdots&b_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ b_{n1}&b_{n2}&\cdots&1\\ \end{pmatrix}, x_t=\begin{pmatrix} x_{1t}\\ x_{2t}\\ \vdots\\ x_{nt}\\ \end{pmatrix}, \Gamma_0=\begin{pmatrix} b_{10}\\ b_{20}\\ \vdots\\ x_{n0}\\ \end{pmatrix}, \Gamma_1=\begin{pmatrix} \gamma_{11} & \gamma_{12}&\cdots&\gamma_{1n}\\ \gamma_{21}& \gamma_{22}&\cdots&\gamma_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ \gamma_{n1}&\gamma_{n2}&\cdots&\gamma_{nn}\\ \end{pmatrix}, x_{t-1}=\begin{pmatrix} x_{1t-1}\\ x_{2t-1}\\ \vdots\\ x_{nt-1}\\ \end{pmatrix}, \varepsilon_t=\begin{pmatrix} \varepsilon_{1t}\\ \varepsilon_{2t}\\ \vdots\\ \varepsilon_{nt}\\ \end{pmatrix}$

とおくと、

$Bx_t=\Gamma_0 + \Gamma_1 x_{t-1}+\varepsilon_t　・・・①$

と書ける。

両辺に $B^{-1}$ を左からかけると、

$x_t=A_0 +A_1 x_{t-1}+e_t　・・・②$

ただし、 $A_0 = B^{-1}\Gamma_0$ ,　 $A_1=B^{-1}\Gamma_1$ ,　 $e_t=B^{-1}\varepsilon_t$ 　である。

①式(構造VARモデル)の撹乱項と②式(誘導VARモデル)の撹乱項の分散共分散行列を確認していく。

①式の撹乱項の分散共分散行列は

$\begin{eqnarray} V(\varepsilon_t)&=&E(\varepsilon_t\varepsilon_t^{'})\\&=&\Sigma_\varepsilon\\ &=&\begin{pmatrix} \sigma_{11}^{\varepsilon}& 0&\cdots&0\\ 0& \sigma_{22}^{\varepsilon}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\sigma_{nn}^{\varepsilon}\\ \end{pmatrix} \end{eqnarray}$

※ $\sigma$ の肩についている $\varepsilon$ は累乗ではなく、「構造VARモデルの」という意味。

②式の撹乱項の分散共分散行列は

$\begin{eqnarray} V(e_t)&=&E(e_te_t^{'})\\&=&\Sigma\\ &=&\begin{pmatrix} \sigma_{11}& \sigma_{12}&\cdots&\sigma_{1n}\\ \sigma_{21}& \sigma_{22}&\cdots&\sigma_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ \sigma_{n1}&\sigma_{n2}&\cdots&\sigma_{nn}\\ \end{pmatrix} \end{eqnarray}$

ここで、 $e_t=B^{-1}\varepsilon_t$ を利用すると、①式の撹乱項の分散共分散行列は

$E(e_te_t^{'})=E(B^{-1}\varepsilon_t\varepsilon_t^{'}(B^{-1})^{'})=B^{-1}E(\varepsilon_t\varepsilon_t^{'})(B^{-1})^{'}　・・・③$

③式に $\Sigma$ , $\Sigma_\varepsilon$ を代入する。

$\begin{pmatrix} \sigma_{11}& \sigma_{12}&\cdots&\sigma_{1n}\\ \sigma_{21}& \sigma_{22}&\cdots&\sigma_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ \sigma_{n1}&\sigma_{n2}&\cdots&\sigma_{nn}\\ \end{pmatrix} = \begin{pmatrix} 1 & b_{12}&\cdots&b_{1n}\\ b_{21}& 1&\cdots&b_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ b_{n1}&b_{n2}&\cdots&1\\ \end{pmatrix}^{-1} \begin{pmatrix} \sigma_{11}^{\varepsilon}& 0&\cdots&0\\ 0& \sigma_{22}^{\varepsilon}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\sigma_{nn}^{\varepsilon}\\ \end{pmatrix} \left[ \begin{pmatrix} 1 & b_{12}&\cdots&b_{1n}\\ b_{21}& 1&\cdots&b_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ b_{n1}&b_{n2}&\cdots&1\\ \end{pmatrix}^{-1} \right]^{'}$

$\Sigma$ は対称行列であることに注意すると、 $\Sigma$ の推定パラメータの数は $\dfrac{n^{2}+n}{2}$ 個である。
$B$ の対角成分がすべて1であることに注意すると、 $B$ の未知パラメータ数は $n^{2}-n$ 個である。
$\Sigma_\varepsilon$ は対角行列であることに注意すると、 $\Sigma_\varepsilon$ の未知パラメータ数は $n$ 個である。
よって構造ショックを識別するためには、 $(n^{2}-n)+n-\dfrac{n^{2}+n}{2}=\dfrac{n^{2}-n}{2}$ 個の制約を $B^{-1}$ に追加する必要がある。

Ⅱ:識別制約の種類

宮尾(2006)は代表的な識別制約として、
①リカーシブな短期制約
②非リカーシブな短期制約
③長期制約
の3つを挙げている。
ここでの「短期」とは変数間の同時点の関係に関する制約のことを指し、
「長期」とは構造ショックの累積的な効果に関する制約のことを指している。

Ⅱ-1:リカーシブな短期制約

リカーシブな短期制約を見ていく。*2

具体的に $B$ を4×4行列とし、前回と同様に対角成分より上の成分をすべて $0$ とする。

$B=\begin{pmatrix} 1 & 0&0&0\\ b_{21}& 1&0&0\\ b_{31}&b_{32}&1&0\\ b_{41}&b_{42}&b_{43}&1\\ \end{pmatrix}$

さらに $x_t$ も

$x_t= \begin{pmatrix} x_{1t}\\ x_{2t}\\ x_{3t}\\ x_{4t}\\ \end{pmatrix}$

とする。

$B$ の見方は以下のとおりである。
①対角成分 $(i,i)$ から見て行方向は, $x_t$ の $i$ 番目の変数が影響を受ける方向を表す
②対角成分 $(i,i)$ から見て列方向は, $x_t$ の $i$ 番目の変数が影響を与える方向を表す

例えば、
$B$ の1行目に着目すると変数 $x_{1t}$ は変数 $x_{2t},x_{3t},x_{4t}$ から影響を受けないこと、
$B$ の1列目に着目すると変数 $x_{1t}$ は変数 $x_{2t},x_{3t},x_{4t}$ に影響を与えることがわかる。

$B$ の2行目に着目すると変数 $x_{2t}$ は変数 $x_{1t}$ から影響を受け、変数 $x_{3t},x_{4t}$ から影響を受けないこと、
$B$ の2列目に着目すると変数 $x_{2t}$ は変数 $x_{3t},x_{4t}$ に影響を与え、変数 $x_{1t}$ に影響を与えないことがわかる。

つまり、 $B$ の対角成分より上の成分をすべて $0$ とする制約をかけることは、
$x_t$ の成分が外生性の高い順に並んでいると仮定していることを意味する。

それぞれの変数が影響を与える順番は以下のような流れになる。

$x_1→x_2→x_3→x_4$

※→は同時点の変数が影響を与える方向を示している。

$x_t$ が4×1行列の場合、変数の並べ方は $4!=24$ 通り存在する。
並べ方によってインパルス応答や分散分解の結果が異なってくるため、
変数の順序付けは重要である。

Ⅱ-2:非リカーシブな短期制約

次に非リカーシブな短期制約を見ていく。
非リカーシブな短期制約では①のリカーシブな短期制約とは異なり、
$B$ を下三角にするような制約をかける必要はなく、経済理論や制度的特徴をもとにして
ゼロ制約を課していく。

以下では安井(2018)を例に非リカーシブな短期制約を見ていく。
安井(2018)はインフレ率の変動要因を分析するために
6つの変数(賃金、コモディティ価格、GDPギャップ、貸出金利、インフレ率、予想インフレ率)を用いて構造VARモデルを推定している。
識別制約として、以下のような非リカーシブな短期制約を用いている。*3

$e_t= \begin{pmatrix} \begin{align*} &e_{賃金,t}\\ &e_{コモディティ価格,t}\\ &e_{GDPギャップ,t}\\ &e_{貸出金利,t}\\ &e_{インフレ率,t}\\ &e_{予想インフレ率,t}\\ \end{align*} \end{pmatrix} = \begin{pmatrix} 1 & 0&0&0&0&0\\ b_{21}& 1&0&0&0&0\\ b_{31}&b_{32}&1&0&0&0\\ b_{41}&0&b_{43}&1&b_{45}&b_{46}\\ b_{51}&0&b_{53}&0&1&b_{56}\\ b_{61}&b_{61}&b_{63}&b_{64}&b_{65}&1\\ \end{pmatrix}^{-1} \begin{pmatrix} &\varepsilon_{賃金,t}\\ &\varepsilon_{コモディティ価格,t}\\ &\varepsilon_{GDPギャップ,t}\\ &\varepsilon_{貸出金利,t}\\ &\varepsilon_{インフレ率,t}\\ &\varepsilon_{予想インフレ率,t}\\ \end{pmatrix} =B^{-1}\varepsilon_t$

6つの構造ショックを識別する必要があるため、 $\dfrac{6^{2}-6}{2}=15$ 個のゼロ制約を課す必要がある。
上式では $B$ に15個のゼロ制約が課されているため、丁度識別されている。

$B$ のゼロ制約の意味を確認していく。
Ⅱ-1のリカーシブな短期制約の場合と同様に、
1.ある変数がどの変数から影響を受けるか
2.ある変数がどの変数に影響を与えるか
を見ていく。

$B$ を行方向に見ていくことで、「ある変数がどの変数から影響を受けるか」を以下のようにまとめることができる。

表1:ある変数がどの変数から影響を受けるか

安井(2018)は貸出金利が賃金、GDPギャップ、貸出金利、インフレ率のショックの影響を受けると
仮定した理由として、GDPギャップとインフレ率に対応して政策金利設定を行うという、中央銀行の金利設定ルールであるテイラー・ルールを企図したことを挙げている。
貸出金利がコモディティ価格のショックの影響を受けないと仮定した理由としては、最適な金融政策の枠組みでは、コモディティ価格のような伸縮的な物価変動ではなく、粘着的な物価変動を安定化させることが中央銀行の望ましい目標であることを挙げている。
他の変数に関しては安井(2018)を参照。

$B$ を列方向に見ていくことで、「ある変数がどの変数に影響を与えるか」を以下のようにまとめることができる。

表2:ある変数がどの変数に影響を与えるか

※安井(2018)では丁度識別になるように制約を課したが、分析者が想定する経済理論や制度的特徴によっては $\dfrac{n^{2}-n}{2}$ 個よりも多い制約を課す場合(過剰識別)もある。その場合は最尤法やGMMを用いて推定を行う。*4

Ⅱ-3:長期制約

③長期制約を見ていく。
長期制約は構造ショックの累積的な効果が長期的に0となるような制約である。
金融政策による貨幣供給量の変動はGDPなどの実物変数に影響を与えないという「貨幣の(長期の)中立性」を考える場合などに長期制約を用いることが望ましい。

以下の2変数誘導VARモデルを考える。

$x_{1t}=a_{10} +a_{11} x_{1t-1}+a_{12} x_{2t-1}+e_{1t}\\ x_{2t}=a_{20} +a_{21} x_{1t-1}+a_{22} x_{2t-1}+e_{2t}$

上記の誘導VARモデルを以下のように構造ショック $\varepsilon_{i}$ のVMA表現に書き直す。

$x_{1t}=\sum\limits_{k=0}^\infty c_{11}(k)\varepsilon_{1t-k} + \sum\limits_{k=0}^\infty c_{12}(k)\varepsilon_{2t-k}\\ x_{2t}=\sum\limits_{k=0}^\infty c_{21}(k)\varepsilon_{1t-k} + \sum\limits_{k=0}^\infty c_{22}(k)\varepsilon_{2t-k}$

ここで、 $e_{1t}$ は

$e_{1t} = c_{11}(0)\varepsilon_{1t} + c_{12}(0)\varepsilon_{2t}$

$e_{2t}$ は

$e_{2t} = c_{21}(0)\varepsilon_{1t} + c_{22}(0)\varepsilon_{2t}$

である。

$c_{ij}(0)$ の値が既知であれば、 $e_{1t},e_{2t}$ から $\varepsilon_{1t},\varepsilon_{2t}$ を識別することができる。
推定した $e_{1t},e_{2t}$ から $V(e_{1t}),V(e_{2t}),Cov(e_{1t},e_{2t})$ を求めることができるため、あと1つ制約条件を追加する必要がある。ここで $\varepsilon_{1t}$ が長期的に $x_{1t}$ に影響を与えない(累積効果が0)という長期制約 $\sum\limits_{k=0}^\infty c_{11}(k)=0$ を制約条件に追加する。
この制約式を変換すると*5