・本稿の内容
区間推定を視覚的に理解するためのコードをメモします。母集団が正規分布で分散が既知である場合の平均値の区間推定を信頼係数95%で実施し、その結果を視覚的に確認します。
Ⅰ:Rコード
母集団がの正規分布に従うとする。母集団の平均値の区間推定を信頼係数95%で実施し、信頼区間を求める。以下に区間推定を行うためのコードを記載する。*1
#区間推定のサンプルコード #サンプルサイズ #※サンプルサイズを大きくすればするほど、信頼区間の幅が狭くなっていく。 n<-50 #サンプル数 N<-100 #グラフ描画 plot(c(0,N),c(40,60),type='n',axes=T,xlab='',ylab='') axis(1) #母集団の平均値50で横線 abline(h=50) y1<-y2<-numeric(N) for(i in 1:N){ #平均50、標準偏差10の正規分布に従う確率変数をn個生成 y<-rnorm(n,50,10) #95%信頼区間の下限値と上限値 y1[i]<-mean(y)+qnorm(0.975,mean = 0,sd = 1)*sd(y)/sqrt(n) y2[i]<-mean(y)-qnorm(0.975,mean = 0,sd = 1)*sd(y)/sqrt(n) #信頼区間の線分を描画 segments(i,y1[i],i,y2[i],lwd = 2) }
上記のコードを実行すると以下のような図が出力される。*2
図1:95%信頼区間
この図は個のサンプルを抽出し、信頼区間を求めるという作業を100回繰り返したときの結果を視覚化したものである。信頼係数95%の区間推定を実施したため、母平均の値50を含む信頼区間が求められる確率は95%となっているはずである。*3図1で母平均の値50を含まない信頼区間の箇所に赤枠を付けたものが以下の図である。
図2:母集団の平均値50を含まない信頼区間
100個の信頼区間のうち、6個に赤枠が付いている。つまり、94%という95%とほぼ同じ確率で母平均の値50を含む信頼区間が求められたということである。