標本分散ではなく不偏分散を利用する理由

未分類

母分散が未知のときに不偏分散を利用します。なぜ、標本分散ではなく不偏分散を利用するのかということを記述していきます。

標本分散の定義
\begin{align*}
s^2=\frac{1}{n}\sum_{i=1}^{n} (X_i – \bar{X})^2
\end{align*}
不偏分散の定義
\begin{align*}
u^2=\frac{1}{n-1}\sum_{i=1}^{n} (X_i – \bar{X})^2
\end{align*}
母分散の代わりに\( u^2\)を利用する理由を説明する上で必要な考え方が「不偏性」という性質です。定義は下記です。
母数\( \theta \) の推定量 \( \hat{\theta} \) が次を満たす時, \( \hat{\theta} \) を\( \theta \) の不偏推定量という。
\begin{align*}
E \left[\hat{\theta} \right] = \theta
\end{align*}
※母数というのは期待値や、分散のことを指します。
※その推定値の期待値が一致することです。

では, \( E[s^2]\)を確認してみます。
\begin{align*}
E \left[ s^2 \right] & = E \left[\frac{1}{n} \sum_{i=1}^{n}(X_i – \hat{X})^2 \right] \\
& = \frac{1}{n} E \left[ \sum_{i=1}^{n} \left\{ (X_i – \mu) \ – (\bar{X} – \mu ) \right\} ^2 \right] \\
& = \frac{1}{n} E \left[ \sum_{i=1}^{n} \left\{ (X_i – \mu)^2 \ -2(X_i – \mu)(\bar{X} – \mu) + ( \bar{X} – \mu )^2 \right\} \right] \\
& = \frac{1}{n} E \left[ \sum_{i=1}^{n} (X_i – \mu)^2 -2(\bar{X} – \mu) \sum_{i=1}^{n}(X_i – \mu) + n( \bar{X} – \mu )^2 \right] \\
& = \frac{1}{n} E \left[ \sum_{i=1}^{n} (X_i – \mu)^2 -2n(\bar{X} – \mu)^2 + n( \bar{X} – \mu )^2 \right] \\
& = \frac{1}{n} E \left[ \sum_{i=1}^{n} (X_i – \mu)^2 -n(\bar{X} – \mu)^2 \right] \\
& = \frac{1}{n} \left\{ E \left[ \sum_{i=1}^{n} (X_i – \mu)^2 \right] -nE \left[ (\bar{X} – \mu)^2 \right] \right\} \\
& = \frac{1}{n} \left\{ \sum_{i=1}^{n} E\left[(X_i – \mu)^2 \right] -nE\left[(\bar{X}-\mu)^2 \right] \right\} \\
& = \frac{1}{n} \left\{ \sum_{i=1}^{n} V\left[X_i \right] -nV\left[\bar{X} \right] \right\} \\
& = \frac{1}{n} \left\{ \sum_{i=1}^{n} {\sigma}^2 -n \cdot \frac{1}{n} {\sigma}^2 \right\} \\
& = \frac{1}{n} \left( n{\sigma}^2 – {\sigma}^2 \right) \\
& = \frac{n-1}{n} {\sigma}^2\\
\end{align*}

したがって,\( s^2 \)は, 不偏推定量ではない。

\( E[s^2] = \frac{n-1}{n} {\sigma}^2 \)を変形し, 不偏推定量となるものを求める。
\begin{align*}
E \left[ s^2 \right] & = \frac{n-1}{n} {\sigma}^2 \\
\frac{n}{n-1} E \left[ s^2 \right] & = {\sigma}^2 \\
E \left[ \frac{n}{n-1} s^2 \right] & = {\sigma}^2 \\
E \left[ \frac{n}{n-1} \cdot \frac{1}{n} \sum_{i=1}^{n} \left( X_i – \bar{X} \right)^2 \right] & = {\sigma}^2 \\
E \left[ \frac{1}{n-1} \sum_{i=1}^{n} \left( X_i – \bar{X} \right)^2 \right] & = {\sigma}^2 \\
E \left[ u^2 \right] & = {\sigma}^2
\end{align*}

よって, \( u^2 \)の期待値は \( {\sigma}^2 \)となります。

\( u^2 \)が分散の不偏推定量となります。

コメント