重回帰分析の係数の標準化

通常のソフトウェアでは重回帰分析の係数の非標準解と標準解を同時に出力する.しかし,それらが出力されない場合,
もしくは手計算の場合は,非標準解にローデータの独立変数の標準偏差をかけて,従属変数の標準偏差で割ると,
標準解が得られるとされている.

まず,標準化されていない回帰式は以下のように書ける.
Y=\beta_0+\beta_1X
簡便のため,単回帰を想定する.

標準化されている回帰式は以下のように書ける.
\frac{Y-\overline{Y}}{S_y}=\beta_0^*+\beta_1^*\frac{X-\overline{X}}{S_x}

ただし,S_yは{tex:Y}のローデータにおける標準偏差を表すとする.

標準化された係数は\beta_0^*のように*をつけてあらわす.
これを変形すると,

Y=S_y \cdot \beta_0^*-\beta_1^* \cdot \frac{S_y}{S_x} \cdot (X-\overline{X})-\overline{Y}

となる.これを定数部分と係数の部分に整理をすると.

Y=S_y \cdot \beta_0^*-\overline{Y}-\beta_1^* \cdot \frac{S_y}{S_x} \cdot \overline{X}+\beta_1^* \cdot \frac{S_y}{S_x} \cdot X

よって係数の部分は,

\beta_1=\beta_1^* \cdot \frac{S_x}{S_y}

となる.
したがって,

\beta_1^*=\beta_1 \cdot \frac{Sx}{Sy}

となる.