・本稿の内容
前回は行列を用いて最少二乗推定量を導出しました。今回は回帰直線の当てはまりの尺度である決定係数を行列を用いて導出します。前回と同じく、回帰モデルの説明変数の数は定数項を含めて個、データのサイズは個()として話を進めます。
Ⅰ:準備
定数項を含めて個の説明変数を持つ以下の重回帰モデルを考える。
を回帰直線と呼ぶ。回帰直線の左辺を理論値と呼ぶ。回帰直線で考えた場合の残差と表すことにすれば、実現値と理論値の差として、
と書くことができる。上式を更に変形すると、
のように実績値を理論値と残差の和として表すことができる。この式の両辺からの平均値を引いて、両辺を二乗してすべてのデータについて和をとると、
Ⅱ:決定係数の導出
決定係数は以下のように定義される。
Ⅰ:準備の結果を用いると、
②式の右辺の行列表記を考える。、とする。は
と書ける。これを用いて、②式の右辺を行列表記していく。
と書ける。(※はの単位行列。)③式のの部分を先に計算していく。
と書ける。*2よって、③式はとなるから、①式はデータのサイズがのとき、
と書ける。データのサイズがのときは、
と書ける。④式の右辺の分数の部分について、分子を(データのサイズ-定数項を含む説明変数の数)、分母を(データのサイズ-)で割った値、
を自由度修正済み決定係数と呼ぶ。