Ⅱ:Rでボックス=ジェンキンスのモデル選択法を実践
新谷・藪訳[2019]の第2章の練習問題問11を例にボックス=ジェンキンスのモデル選択法を実践していく。*2
以下で使用するデータはここにアップされているSIM2.XLSの系列である。
は
から発生させたものである。
・問11の(a)
以下のコードを実行し、y3系列をグラフ化する。
library("tidyverse")
library("rugarch")
data <- read.xls("C:/Users/81803/Desktop/SIM2.xls")
Y3 <- data[,"y3"]
data%>%
ggplot()+
geom_line(aes(x = X,y= y3))+
labs(title = "y3系列")+
theme(
plot.title = element_text(hjust = 0.5),
)
図1;
系列のグラフ
図1をみると、平均と分散がおおむね安定しているように見える。*3
次に以下のコードを実行し、とを求める。
acf.Y3 <- acf(Y3,lag.max=20,tck=.02,xlab="",ylab="",main="")
acf.Y3
pacf.Y3 <- pacf(Y3,lag.max=20,tck=.02,xlab="",ylab="",main="")
pacf.Y3
図2:ACF
図3:PACF
の理論上のは0に減衰し*4、理論上のは3次以上で0となる。図2を見ると、は振動しながら0に収束しているように見える。図3を見ると3次以上でほぼ0であり、モデルが候補のモデルとして考えられる。
・問11の(b)
ここでは、(a)の結果、モデルを推定するべきだと判断したとして、モデルを推定し、そのモデルを診断してみる。
以下のコードを実行し、モデルを推定する。
spec.ar1 <- arfimaspec(mean.model = list(armaOrder=c(1,0),include.mean=FALSE))
fit.ar1 <- arfimafit(spec=spec.ar1,data=Y3)
fit.ar1
実行結果の一部を以下に抜粋する。
図4:推定結果
実行結果より、推定されたモデルは
である。※()は値。図4には記載されていないが、(赤池情報量基準)の値は0.695である。
次に残差の診断を行うために、以下のコードを実行する。
res.ar1 <- fit.ar1@fit$residuals
Box.test(res.ar1,lag=1,type="Ljung-Box")
Box.test(res.ar1,lag=2,type="Ljung-Box")
Box.test(res.ar1,lag=3,type="Ljung-Box")
実行結果は以下である。
図5:リュン=ボックス検定の結果
図5を見るとすべてのラグ次数でQ統計量の値(X-squared)が大きい(つまり、値が小さい。)ため、「残差に自己相関が無い」という帰無仮説を棄却できる。よって、系列相関が存在する可能性があるため、モデルは不適切なモデルであると判断できる。*5
・問11の(c)
問11の(b)で実施したことをで同様に実施する。本稿では省略するが、もと同様に不適切なモデルであることが確認できる。
・問11の(d)
ここでは、(a)の結果、モデルを推定するべきだと判断したとして、モデルを推定し、そのモデルを診断してみる。
以下のコードを実行し、モデルを推定する。
spec.ar2 <- arfimaspec(mean.model = list(armaOrder=c(2,0),include.mean=FALSE))
fit.ar2 <- arfimafit(spec=spec.ar2,data=Y3)
fit.ar2
実行結果の一部を以下に抜粋する。
図6:推定結果
実行結果より、推定されたモデルは
である。※()は値。図6には記載されていないが、(赤池情報量基準)の値は0.454である。
推定された係数を見ると、真のデータ生成過程である
の係数とほぼ同じ値になっている。さらに、AICの値が問11(b)で推定したモデルよりも小さくなっており、データのあてはまりも改善していると言える。*6
次に残差の診断を行うために、以下のコードを実行する。
res.ar2 <- fit.ar2@fit$residuals
Box.test(res.ar2,lag=1,type="Ljung-Box")
Box.test(res.ar2,lag=2,type="Ljung-Box")
Box.test(res.ar2,lag=3,type="Ljung-Box")
実行結果は以下である。
図7:リュン=ボックス検定の結果
図7を見るとすべてのラグ次数でQ統計量の値(X-squared)が小さい(つまり、値が大きい。)ため、「残差に自己相関が無い」という帰無仮説を棄却できない。よって、系列相関が存在するとは言えず、モデルは適切なモデルであると判断できる。
・参考文献
ウォルター・エンダース著,新谷元嗣・薮友良訳 (2019)『実証のための計量時系列分析』有斐閣
・参考サイト
ウォルター・エンダース著,新谷元嗣・薮友良訳 (2019)のサポートページwww.fbc.keio.ac.jp
David Gabauer氏のホームページsites.google.com
パッケージ「rugarch」のドキュメント
https://cran.r-project.org/web/packages/rugarch/rugarch.pdf