お勉強メモ

経済学・計量経済学・統計学などのお勉強メモです。

統計学メモ:統計検定準1級参考資料

・本稿の内容
2度の不合格を経て、統計検定準1級に合格できました(※3回ともCBT移行後の受験です)。受験勉強の際に参考にした資料(書籍とWeb資料)まとめておきます。準1級の受験を考えている方の参考になれば幸いです。
・本文

1.参考にした資料

必須の2冊

まずは必須の2冊から。

日本統計学会編(2020)『日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック』学術図書出版社
日本統計学会編(2021)『日本統計学会公式認定 統計検定 準1級 公式問題集』実務教育出版

①と②の2冊は購入必須でしょう。特に①を購入せずに挑むのは自殺行為だと思います(笑)①をメインテキストとして、①のみでは理解できないところを別の資料で補っていきましょう。

2級の復習

2級レベルの内容を復習する際に使用した資料を紹介します。

森棟公夫ほか(2015)『統計学 改訂版』有斐閣
①を読み進めるなかで、「2級レベルの知識があやしいな」と思うことが多々ありました。そんなときに本書を使用して2級レベルの知識の確認を行いました。確率分布や推定、検定の基礎的な話題がコンパクトにまとまっている良書です。

汪金芳ほか(2020)『弱点克服 大学生の統計学』東京図書
準1級の試験結果レポートには1.確率と確率分布、2.統計的推測、3.多変量解析法、4.種々の応用という4つのセクションの正解率が記載されます。

私は1と2のセクションの正解率が低かったです。本書の2~5章にはその部分を補うのに適した問題が多数掲載されています。1と2のセクションではパターンで瞬殺できるような問題は少なく、2級レベルの確率分布、推定、検定の基本知識がしっかりと身についていることを前提としたうえで、少し考えなければ分からないという問題が多く出題される印象を持っています。本書で問題演習をしながら、自分の知識が曖昧な部分を見つけて、その部分を補強するようにしていました。

2級の内容をより深く

2級レベルの内容をより深く理解するために使用した資料を紹介します。

岩田暁一(1983)『経済分析のための統計的方法 第2版』東洋経済新報社
経済学界隈では有名な参考書です。重厚長大な内容ですので、通読するのではなく、より深く理解したいという箇所をピックアップして読むことをお勧めします。私は変数変換(5章)、モーメント母関数(5章)、分散分析(11章)、尤度比検定(15章)の部分を中心に読みました。

回帰分析関連

回帰分析関連の参考書を紹介します。

山本拓(1995)『計量経済学』新世社
経済学徒御用達の参考書です。1~6章で最少二乗法、単回帰、重回帰、F検定などの基本事項が丁寧に解説されています。7章以降は準1級の範囲とあまり関連が無いので読む必要はありません。
※2022年に第2版が出版されています。

藤山英樹(2007)『統計学からの計量経済学入門』昭和堂
⑥はすべてスカラー演算で記載されています。⑥で学習した内容を行列演算で確認する際におすすめです。
※2023年11月現在、在庫が品切れで重版未定となっており、新品での入手が難しく、中古を高い値段で購入するしかない状態になっています。出版社のXアカウントで本書を大学の教科書として使用している人を探しているポストをしていました。大学の参考書としての使用が見込まれれば重版がかかるのでしょうか・・・
※2024年3月に電子書籍版が発売されました。YONDEMILLという電子書籍サービスで購入可能です。

西山慶彦ほか(2019)『計量経済学』有斐閣
本書の8章(制限従属変数モデル)でロジットモデル、プロビットモデル、トービットモデルの知識を補強しました。

Annette J.Dobson著,田中豊ほか訳(2008) 『一般化線形モデル入門 原著第2版』共立出版
本書の10章(生存時間解析)で生存関数、ハザード関数、比例ハザードモデル、カプラン・マイヤー推定量などの知識を補強しました。

確率過程、時系列分析関連

確率過程、時系列分析関連の資料を紹介します。

竹居正登(2020)『入門 確率過程』森北出版
マルコフ連鎖と確率過程に関しては基本的に①のみで済ませました。①に記載されてる内容以上のことを知りたい場合に本書のマルコフ連鎖ブラウン運動などの箇所をつまみ読みすると良いでしょう。

Walter Enderse著,新谷元嗣,藪友良訳(2019)『実証のための計量時系列分析』有斐閣
本書の1章(差分方程式)、2章(定常時系列モデル)の内容を押さえておけば困ることはないでしょう。(スペクトラムなどの周波数領域の話題は除く。)①の時系列解析のところには状態空間モデルや単位根の話も出てきますが、過去問で出題されたことはありません。私はCBT方式に移行してから3度受験しましたが、出題されませんでした。

多変量解析(主成分分析、判別分析、因子分析、クラスター分析)

多変量解析の参考資料を紹介します。

小西貞則(2010)『多変量解析入門-線形から非線形へ-』岩波書店
①の多変量解析の章は途中計算の記述が丁寧ではありません。本書はそこの部分を補うのに最適な参考書だと思います。個人的なお気に入りポイントは、分かりやすい例えが随所に登場するところです。一例をあげると、ユーグリット距離とマハラノビス距離の違いを斜面の勾配に例えているところ(P144)、サポートベクターマシーンのマージン最大化を幅広い道路の建設に例えているところ(P197)です。こういった例えがあることによって、初めて学ぶ概念の理解が容易になった気がします。

原田史子・島川博光(2016)『線形代数学に基づくデータ分析法』共立出版
線形代数の基本知識とその応用例として多変量解析の各手法を学ぶことができます。⑫は行列表記などの線形代数の基礎知識は既知として記述されています。線形代数の知識に不安がある方は⑫の前にこちらを読んでおくとよいかもしれません。私は5章(クラスター分析)の部分をよく読みました。階層的クラスタリングの例として、最短距離法とWard法の例題が、非階層的クラスタリングの例として、k-means法の例題が掲載されています。例題の解説は非常に丁寧で分かりやすいです。
※2023年9月に加筆修正版が出版されています。

加藤豊(2020)『例題でよくわかる はじめての多変量解析』森北出版
⑫と同様に多変量解析の途中計算の部分を補うのに適した参考書です。⑫があれば本書は特に必要ないと思います。
線形代数の部分の記述で大きな誤りがあったようで、Twitterで叩かれていました(笑)


私が購入した第2刷では修正されていました。出版社のページに正誤表があります。

ベイズ統計

ベイズ統計の参考資料を紹介します。

涌井良幸(2009)『道具としてのベイズ統計』日本実業出版社
本書を読んでおけば事後分布を求める系の問題(ベータ二項モデル、ガンマポアソンモデルなど)は瞬殺できます。

馬場信哉(2019)『RとStanではじめるベイズ統計モデリングによるデータ分析入門』講談社
①と⑮のメトロポリス・ヘイスティング法の解説が個人的に分かりづらかったので、本書の第1部7章(MCMCの基本)で補強しました。RとStanの環境を用意することで実際にシミュレーションしてみることもできます。

数学

数学の参考資料を紹介します。

永田靖(2005)『統計学のための数学入門30講』朝倉書店
統計学を学習する際に必要となる数学がコンパクトに解説されています。各講の最後で「統計学ではこう使う」というコーナーがあり、その講で学習した数学の統計学での使い方を知ることができます。

石井俊全(2011)『まずはこの一冊から 意味が分かる線形代数』ペレ出版
準1級では線形代数の知識もある程度必要になってきます。本書は線形代数の必要最低限の知識を分かりやすく丁寧に解説しています。私は5章(対角化の意味)がお気に入りです。5章で固有値固有ベクトルの意味を掴んでおけば、主成分分析などの理解が深まると思います。

石井俊全(2014)『1冊でマスター 大学の微分積分』技術評論社
多変数関数の微分積分の知識が不足していたので本書で補強しました。6章(2変数関数の積分)に変数変換の丁寧な解説があります。

各種Web資料

まずはYoutubeチャンネルを紹介します。

⑳はじめての統計学
youtube.com

Yuya Kawaguchi
youtube.com

両チャンネル共に統計検定2級、準1級に関しての解説動画が多数アップされています。㉑の運営者さんはUdemyでも動画を公開されています。ホワイトボードの字がとてもきれいです。

次に学習サイトを紹介します。

㉒あつまれ統計の森
www.hello-statisticians.com
①、②に関する分かりやすい解説が多く掲載されています。

最後に受験体験記を紹介します。

㉓【受験体験記】統計検定準1級~PBT試験に落ちて、CBT試験に合格した話~
industrial-data-science.com

㉔【2021年度】統計検定準1級に合格しました。【歴代最高難易度】
syleir.hatenablog.com

㉕統計検定準1級に受かるための勉強法・参考サイト
zenn.dev

学習計画を立てる際に合格者の方々の体験記を大いに参考にさせてもらいました。

2.おまけ:過去問を分野ごとにまとめました。

過去問題集は分野ごとの索引がないので、「今日はこの分野の問題だけを集中的に解きたい!」といったときに不便です。ワークブックの章立てに従って、過去問題を私の独断と偏見で分類しました。分野別で過去問演習をするときに参考にしてください。

確率と確率変数(1章:事象と確率~4章:変数変換、7章:極限定理、漸近理論)

2021年問1(事象と確率)
2021年問2(期待値と分散、漸近分散)
2018年問1(条件付き確率、ベイズの定理)
2018年問2(期待値と分散)
2017年問1(加重平均、幾何平均、調和平均)
2017年問2(二項分布)
2017年問4(期待値と分散)
2017年問5(2変量正規分布)
2016年問1(変動係数)
2016年問2(期待値と分散)
2015年問1(事象と確率)
2015年問7(2変量正規分布)
2015年問9(正規分布のモーメント母関数)

種々の確率分布(5章:離散型分布、6章:連続型分布と標本分布)

2021年問3(3変量正規分布)
2019年問1(ポアソン分布)
2019年問2(幾何分布)
2015年問4(正規分布)

統計的推測(8章:統計的推定の基礎~13章:ノンパラメトリック法)

2021年問2(最尤推定量)
2021年問8(サンプルサイズ)
2021年問12(無相関検定)
2021年問3(母比率の検定、サンプルサイズ)
2018年問4(母比率の差の検定)
2018年問5(ウィルコクソンの順位和検定)
2018年問6(混合正規分布)
2017年問6(多項分布の信頼区間、多項分布の差の信頼区間)
2016年問3(適合度検定)
2016年問4(1標本の分散の検定、2標本の分散の検定)
2016年問5(母比率の検定、検出力、サンプルサイズ)
2015年問2(生産者危険、消費者危険)
2015年問3(母比率の信頼区間、サンプルサイズ)
2015年問7(母平均の検定)

14章:マルコフ連鎖

2019年問11
2017年問11
2016年問11
2015年論述問1

15章:確率過程の基礎

2019年問9(ブラウン運動)
2017年論述問2(ポアソン過程)

16,17章:重回帰分析、回帰診断法

2021年問4
2021年問5
2021年論述問3
2019年問8(正則化、Fused Lasso)
2018年問10(正則化)
2017年問3(正則化)
2016年問6(自由度修正済み決定係数、DW比)

18章:質的回帰

2019年問10(ロジスティック回帰モデル)
2018年論述問2(プロビットモデル、トービットモデル)
2015年論述問3(ロジスティック回帰モデル)

19章:回帰分析その他

2016年問8(生存時間解析)

20章:分散分析と実験計画法

2019年論述問1(1元配置)
2018年論述問3(2元配置、乱塊法)
2017年問7(乱塊法)
2017年論述問3(実験計画法)
2016年問9(2元配置)
2015年問11(実験計画法)

21章:標本調査法

2017年問9(非復元単純無作為抽出)
2016年問13(層化抽出法、標本配分法)
2015年問5(標本抽出法)

22章:主成分分析

2021年問11(自己符号化器)
2019年問6
2018年問7
2017年論述問1
2015年問16

23章:判別分析

2021年問6(フィッシャーの線形判別分析)
2019年論述問3(2次判別分析、サポートベクターマシン)
2018年問3(線形判別分析、サポートベクターマシン)
2016年問14(線形判別分析、サポートベクターマシン)

24章:クラスター分析

2018年問7(ウォード法)
2017年問13(最短距離法、最長距離法、k-means法)

25章:因子分析・グラフィカルモデル

2021年問9(2因子モデル)
2019年論述問2(グラフィカルモデル)
2018年論述問1(構造方程式)
2018年問11(2因子モデル)

26章:その他の多変量解析手法

なし

27章:時系列解析

2021年問10(スペクトラム、ユールウォーカー)
2019年問12
2018年問8
2018年問12
2017年問8
2016年問6
2015年問10
 

28章:分割表

2019年問4
2019年問5(前向き研究、後ろ向き研究)
2018年問9(クラメールの連関係数)
2017年問10(イェーツ補正)
2016年論述問3(グラフィカルモデル)
2015年問12
2015年論述問3

29章:不完全データの統計処理

2021年論述問3(回帰代入)
2016年問12(EMアルゴリズム)
2015年問6(回帰代入)

30章:モデル選択

2021年問7(AICBIC、交差検証法)
2017年論述問1(AIC)
2016年論述問2(AIC)
2015年論述問2(AIC)

31章:ベイズ

2021年論述問2(ベータ二項モデル、メトロポリス・ヘイスティング法)
2019年問7(標本の確率分布が正規分布)
2018年問13(メトロポリス・ヘイスティング法)
2015年問13(ベータ二項モデル)

32章:シミュレーション

2017年問12(ブートストラップ法)
2015年問14(モンテカルロ法)

統計学メモ:2変量正規分布

・本稿の内容
2変量正規分布についての基本事項をメモします。

・本文

Ⅰ: 2変量正規分布の同時確率密度関数

確率変数ベクトル\boldsymbol{x} = 
\left(\begin{array}{c}
x_1\\ 
x_2\\
\end{array}\right)が平均ベクトル\boldsymbol{\mu} =\left(\begin{array}{c}
\mu_1\\
\mu_2\\
\end{array}\right)
,分散共分散行列\boldsymbol{\Sigma}=\begin{pmatrix}
\sigma_{11} & \sigma_{12}\\
\sigma_{21} & \sigma_{22}\\
\end{pmatrix}の2変量正規分布に従うとき、



\boldsymbol{x} = 
\left(\begin{array}{c}
x_1\\ 
x_2\\
\end{array}\right)
\sim N(\boldsymbol{\mu},\boldsymbol{\Sigma})=
N
\left
(
\left(\begin{array}{c}
\mu_1\\
\mu_2\\
\end{array}\right)
,
\begin{pmatrix}
\sigma_{11} & \sigma_{12}\\
\sigma_{21} & \sigma_{22}\\
\end{pmatrix}
\right
)・・・①

と書く。

2変量正規分布確率密度関数


f(\boldsymbol{x})=\dfrac{1}{(\sqrt{2\pi})^{2}\sqrt{\mid \boldsymbol{\Sigma} \mid}}exp\left[-\dfrac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu})^t \boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})\right]・・・②

と書ける。②式をベクトル表記、行列表記を用いずに、スカラー表記で書き換えてみる。(※\mid \boldsymbol{\Sigma} \mid\boldsymbol{\Sigma}行列式。)

ここで


\mid \boldsymbol{\Sigma} \mid = 
\sigma_{11}\sigma_{22}-\sigma_{12}\sigma_{21}・・・③

である。\sigma_{12}=\sigma_{21}\sigma_{12}^2=\rho_{12}^{2}\sigma_{11}\sigma_{22}(※\rho_{12}は相関係数)に注意してさらに書き直すと


\begin{eqnarray}
\mid \boldsymbol{\Sigma} \mid
&=& 
\sigma_{11}\sigma_{22}-\sigma_{12}\sigma_{21}\\
&=&
\sigma_{11}\sigma_{22}-\rho_{12}^{2}\sigma_{11}\sigma_{22}\\
&=&
\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})・・・④\\
\end{eqnarray}

と書ける。④式を利用して、\boldsymbol{\Sigma}^{-1}を求める。


\begin{eqnarray}
\boldsymbol{\Sigma}^{-1} 
&=& \dfrac{1}{\mid \boldsymbol{\Sigma} \mid}
\begin{pmatrix}
\sigma_{22} & {-}\sigma_{12}\\
{-}\sigma_{21} & \sigma_{11}\\
\end{pmatrix}\\
&=&
\dfrac{1}{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}
\begin{pmatrix}
\sigma_{22} & {-}\sigma_{12}\\
{-}\sigma_{21} & \sigma_{11}\\
\end{pmatrix}・・・⑤\\
\end{eqnarray}

⑤式を用いて、②式の(\boldsymbol{x}-\boldsymbol{\mu})^t \boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})を計算する。


\begin{eqnarray}
(\boldsymbol{x}-\boldsymbol{\mu})^t \boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})
&=&
(x_{1}-\mu_{1},x_{2}-\mu_{2})\boldsymbol{\Sigma}^{-1}\left(\begin{array}{c}
x_1-\mu_{1}\\ 
x_2-\mu_{2}\\
\end{array}\right)\\
&=&
\dfrac{1}{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}
(x_{1}-\mu_{1},x_{2}-\mu_{2})
\begin{pmatrix}
\sigma_{22} & {-}\sigma_{12}\\
{-}\sigma_{21} & \sigma_{11}\\
\end{pmatrix}
\left(\begin{array}{c}
x_1-\mu_{1}\\ 
x_2-\mu_{2}\\
\end{array}\right)\\
&=&
\dfrac{1}{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}
[\sigma_{22}(x_{1}-\mu_{1})-\sigma_{21}(x_{2}-\mu_{2}),-\sigma_{12}(x_{1}-\mu_{1})+\sigma_{11}(x_{2}-\mu_{2})]
\left(\begin{array}{c}
x_1-\mu_{1}\\ 
x_2-\mu_{2}\\
\end{array}\right)\\
&=&
\dfrac{1}{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}
[\sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}   ]・・・⑥\\
\end{eqnarray}

④式と⑥式を用いて②式を書き直すと②式のスカラー表記版の式が得られる。


\begin{eqnarray}
f(\boldsymbol{x})&=&\dfrac{1}{(\sqrt{2\pi})^{2}\sqrt{\mid \boldsymbol{\Sigma} \mid}}exp\left[-\dfrac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu})^t \boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})\right]\\
&=&
\dfrac{1}{2\pi\sqrt{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}}exp\left[-\dfrac{1}{2\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}\left\lbrace \sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}  \right\rbrace\right]・・・⑦
\end{eqnarray}

Ⅱ: 2変量正規分布の周辺確率密度関数

x_{1}の周辺確率密度関数f(x_{1})=\int_{-\infty}^{\infty}f(x_{1},x_{2})dx_{2}を求める。⑦式を用いるとx_{1}の周辺確率密度関数


\begin{equation}
\begin{split}
f(x_{1})
&=\dfrac{1}{2\pi\sqrt{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}}\\
&\quad×\int_{-\infty}^{\infty}exp\left[-\dfrac{1}{2\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}\left\lbrace \sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}  \right\rbrace\right]dx_{2}・・・⑧
\end{split}
\end{equation}

と書ける。ここで⑧式右辺の\lbrace\rbraceのなかに注目し、式変形を行う。


\left\lbrace \sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}  \right\rbrace\\
=\left\lbrace \rho_{12}^{2}\sigma_{22}(x_{1}-\mu_{1})^{2}+(1-\rho_{12}^{2})\sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}  \right\rbrace・・・⑨

⑨式を⑧式に当てはめ、⑧式のexp(1-\rho_{12}^{2})\sigma_{22}(x_{1}-\mu_{1})^{2}の部分を\intの外側に出し、式を整理する。



\begin{equation}
\begin{split} 
f(x_{1})&=\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{11}}}exp\left[ -\dfrac{(x_{1}-\mu_{1})^{2}}{2\sigma_{11}}\right]\int_{-\infty}^{\infty}\dfrac{1}{\sqrt{2\pi}\sqrt{1-\rho_{12}^{2}}\sqrt{\sigma_{22}}}\\


&\quad ×exp\left[-\dfrac{1}{2\sigma_{22}(1-\rho_{12}^{2})}\left\lbrace (x_{2}-\mu_{2})-\rho_{12}^{2}\dfrac{\sqrt{\sigma_{22}}}{\sqrt{\sigma_{11}}}(x_{1}-\mu_{1}) \right\rbrace ^{2}\right]dx_{2}・・・⑩
\end{split} 
\end{equation}

⑩式の積分N\left(\mu_{1}+\rho_{12}^{2}\dfrac{\sqrt{\sigma_{22}}}{\sqrt{\sigma_{11}}}(x_{1}-\mu_{1}),\sigma_{22}(1-\rho_{12}^{2})\right)に従う確率変数の確率密度関数-\inftyから\inftyまでを積分しているから、積分の値は1である。

よって



f(x_1)=\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{11}}}exp\left[ -\dfrac{(x_{1}-\mu_{1})^{2}}{2\sigma_{11}}\right]・・・⑪

となる。同様にしてf(x_2)



f(x_2)=\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{22}}}exp\left[ -\dfrac{(x_{2}-\mu_{2})^{2}}{2\sigma_{22}}\right]・・・⑫

となる。

Ⅲ: 2変量正規分布の条件付き期待値、分散

x_1の条件付き期待値E[ x_1 \mid x_2],条件付き分散V[ x_1 \mid x_2]を求める。
x_1の条件付き分布は



f(x_1\mid x_2)=\dfrac{f(x_1,x_2)}{f(x_2)}

である。本稿では⑦式が分子、⑫式が分母に対応する。⑦式と⑫式を用いて計算を進める。




\begin{equation}
\begin{split} 
f(x_1\mid x_2)&=\dfrac{f(x_1,x_2)}{f(x_2)}\\
&=\dfrac{1}{2\pi\sqrt{\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}}exp\left[-\dfrac{1}{2\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}\left\lbrace \sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}  \right\rbrace\right]\\
 & \quad ÷\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{22}}}exp\left[ -\dfrac{(x_{2}-\mu_{2})^{2}}{2\sigma_{22}}\right]\\
&=\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{11}(1-\rho_{12}^{2})}}\\
 & \quad ×exp\left[-\dfrac{1}{2\sigma_{11}\sigma_{22}(1-\rho_{12}^{2})}\left\lbrace \sigma_{22}(x_{1}-\mu_{1})^{2} -2\sigma_{12}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\sigma_{11}(x_{2}-\mu_{2})^{2}-\sigma_{11}(1-\rho_{12}^{2})(x_{2}-\mu_{2})^{2}  \right\rbrace\right]\\
&=\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{11}(1-\rho_{12}^{2})}}\\
 & \quad ×exp\left[-\dfrac{1}{2\sigma_{11}(1-\rho_{12}^{2})}\left\lbrace (x_{1}-\mu_{1})^{2} -2\dfrac{\sigma_{12}}{\sigma_{22}}(x_{1}-\mu_{1})(x_{2}-\mu_{2})+\dfrac{\sigma_{11}}{\sigma_{22}}\rho_{12}^{2}(x_{2}-\mu_{2})^{2}  \right\rbrace\right]\\
&=\dfrac{1}{\sqrt{2\pi}\sqrt{\sigma_{11}(1-\rho_{12}^{2})}}\\
 & \quad ×exp\left[-\dfrac{1}{2\sigma_{11}(1-\rho_{12}^{2})}\left\lbrace (x_{1}-\mu_{1})+\dfrac{\sqrt{\sigma_{11}}}{\sqrt{\sigma_{22}}}\rho_{12}(x_{2}-\mu_{2})  \right\rbrace ^{2}\right]・・・⑬\\
\end{split} 
\end{equation}

⑬式の形より、条件付き期待値と条件付き分散は



E[ x_1 \mid x_2]=\mu_{1}+\dfrac{\sqrt{\sigma_{11}}}{\sqrt{\sigma_{22}}}\rho_{12}(x_{2}-\mu_{2})\\
V[ x_1 \mid x_2]=\sigma_{11}(1-\rho_{12}^{2})

となる。

経済学メモ:経済学でよく使う数式②

・本稿の内容
ある変数X(例えば消費者物価指数などを想定してください)のt期における変化率g_{t}



g_{t}=\dfrac{X_{t}-X_{t-1}}{X_{t-1}}

と書くことができます。このg_{t}は以下のようにX_{t}X_{t-1}の自然対数差分で近似することができます。



g_{t}=\dfrac{X_{t}-X_{t-1}}{X_{t-1}} \approx \log X_{t}-\log X_{t-1}

上式のように書ける理由と、実際の時系列データを使用して\dfrac{X_{t}-X_{t-1}}{X_{t-1}}\log X_{t}-\log X_{t-1}がほぼ同じ値になることを確認します。

・本文

Ⅰ:近似式の導出

f(x)=log (1+x)とする。
f(x)を1回微分すると



f^{'}(x)=\dfrac{1}{1+x}=\dfrac{(-1)^{1-1}(1-1)!}{(1+x)^{1}}

である。
f(x)を2回微分すると



f^{(2)}(x)=\dfrac{-1}{(1+x)^{2}}=\dfrac{(-1)^{2-1}(2-1)!}{(1+x)^{2}}

である。

f(x)を3回微分すると



f^{(3)}(x)=\dfrac{2}{(1+x)^{3}}=\dfrac{(-1)^{3-1}(3-1)!}{(1+x)^{3}}
である。

f(x)を4回微分すると



f^{(4)}(x)=\dfrac{-6}{(1+x)^{4}}=\dfrac{(-1)^{4-1}(4-1)!}{(1+x)^{4}}
である。

f(x)をn回微分すると



f^{(n)}(x)=\dfrac{(-1)^{n-1}(n-1)!}{(1+x)^{n}}・・・①
である。

log (1+x)x=0テイラー展開(マクローリン展開)する。①式より、n次の係数は



\dfrac{f^{(n)}(0)}{n!}=\dfrac{\dfrac{(-1)^{n-1}(n-1)!}{(1+0)^{n}}}{n!}=\dfrac{(-1)^{n-1}}{n}

であるから、



log (1+x)=x-\dfrac{1}{2}x^{2}+\dfrac{1}{3}x^{3}-\dfrac{1}{4}x^{4}+\cdots ・・・②

となる。よって、②式より、log (1+x)の1次近似は



log (1+x)\approx x

となる。xg_{t}=\dfrac{X_{t}-X_{t-1}}{X_{t-1}}を代入すると



\begin{eqnarray}
g_{t}\approx log (1+g_{t})&=&log (1+\dfrac{X_{t}-X_{t-1}}{X_{t-1}})\\
&=&log (\dfrac{X_{t}}{X_{t-1}})\\
&=& \log X_{t}-\log X_{t-1}
\end{eqnarray}

となる。

Ⅱ:実際のデータで確認

消費者物価指数(総合)の年次データ(2000年~2021年)を用いて、\dfrac{X_{t}-X_{t-1}}{X_{t-1}}\log X_{t}-\log X_{t-1}を比較していく。消費者物価指数のデータはここから取得した。

取得したデータをExcelを用いて以下の画像のように整理する。

\dfrac{X_{t}-X_{t-1}}{X_{t-1}}で求めた値を「通常」列、\log X_{t}-\log X_{t-1}で求めた値を「対数差」列に記載している。(どちらも100をかけている。)計算された値を見ると、両者でほとんど差がないことが確認できる。

・参考文献
石井俊全(2014)『1冊でマスター 大学の微分積分』技術評論社