以前の専門ブログで、賃貸マンションの家賃の決定要因についての分析を行った。その事例を用いて解説する。
賃貸マンションの平米あたりの月極め家賃[math]Y[/math]は、駅から徒歩分数[math]X_1[/math], 築年数[math]X_2[/math]に依存して変動する。各要因が家賃に線形に影響を及ぼすとすると、以下のように書ける。
[math]
Y=\alpha +\beta _1 X_1 + \beta _2 X_2
[/math]
より一般的に説明変数をp個として、n個の個体(ケース)についてのデータが得られているとする。
i番目の個体についての被説明変数は[math]y_i[/math]、説明変数は[math]x_{i1} , x_{i2} , \cdots, x_{ip} [/math]である。以下の構造式を考える。
[math]
y_i=\alpha +\beta _1 x_{i1} +\beta _2 x_{i2} + \cdots +\beta _p x_{ip} +\epsilon _i
[/math]
ただし[math]\epsilon _i[/math]は互いに独立に正規分布[math]N(0,\sigma ^2 )[/math]にしたがう。残差平方和
[math]
S_e = \sum_{i=1}^n e_i ^2
[/math]
[math]
=\sum_{i=1}^n (y_i -(\alpha + \beta _1 x_{i1} + \beta _2 x_{i2} + \cdots +\beta _p x_{ip} +\epsilon _i))^2
[/math]
を最小にする[math]\alpha , \beta _1 ,\beta _2 ,\cdots ,\beta _p[/math]を求めるために、[math]S_e[/math]を[math]\alpha , \beta _1 ,\beta _2 ,\cdots ,\beta _p[/math]それぞれで偏微分した式を0と置くと、[math]\alpha , \beta _1 ,\beta _2 ,\cdots ,\beta _p[/math]に関するp+1次元連立一次方程式
[math]
X’X\boldsymbol{\beta}=X’\boldsymbol{y}
[/math]
を得る。最小二乗解は、
[math]
\hat{\boldsymbol{\beta}}=(X’X)^{-1} X’\boldsymbol{y}
[/math]
である。yの総変動の分解は単回帰と同様に、
[math]
S_{yy}=S_R + S_e =\sum_{i=1}^n (\hat{y}_i -\bar{y})^2 +\sum_{i=1}^n (y_i -\hat{y}_i)^2
[/math]
となる。ここでの回帰係数は「偏回帰係数」とも呼ばれ、「他の説明変数の値を固定したとき、j番目の説明変数を1単位増やしたら、被説明変数の値がどれだけ増えるか」を表す。