統計検定準1級に合格するには,短い時間内に大量の処理をする必要があります.
それには過去問を素早く解く練習が適しています.
問題を解く際に覚えておくべきサンプル平均の期待値,分散,不偏推定量についてまとめました.
これらは,標準化や中心極限定理でも利用する重要な性質です.
サンプル平均\bar{X}の期待値,分散
サンプル平均\bar{X}とは,nのデータの平均のこと.\bar{X}=\displaystyle \frac{1}{n} \displaystyle \sum_{i=1}^{n}X_i
(1)E[\bar{X}]を求めよ.
(2)V[\bar{X}]を求めよ.
(1)E[\bar{X}]E[\bar{X}]=E\left [\displaystyle \frac{1}{n} \displaystyle \sum_{i=1}^{n}X_i \right ]=\displaystyle \frac{1}{n} \displaystyle \sum_{i=1}^{n} E\left [ X_i \right ]=\displaystyle \frac{1}{n}n\mu (∵ E[X]=\mu)=\mu∴ E[\bar{X}]=\mu.
(2)V[\bar{X}]V[\bar{X}]=V\left [\displaystyle \frac{1}{n} \displaystyle \sum_{i=1}^{n}X_i \right ]=\displaystyle \frac{1}{n^2} \displaystyle \sum_{i=1}^{n} V\left [ X_i \right ](∵V[aX+b]=a^2V[X])=\displaystyle \frac{\sigma^2}{n} (∵V[X]=\sigma^2)∴ V[\bar{X}]=\frac{\sigma^2}{n}.
これにより,サンプル平均\bar{X}の期待値は不偏性を持つことが分かります.
つまり,サンプルで平均を取ったものの期待値は,母集団の真の期待値を推定する良い値ということです.
式により,サンプル数nに依らないことが分かります.
また,分散については,サンプル数nが大きくなればなるほど,V[\bar{X}]=\displaystyle \frac{\sigma^2}{n}が0に近づきます.
つまり,ばらつきが無くなるということです.(大数の法則)
E[\bar{X}^2]の計算
次の計算方法もおさえておきます.
分散の計算をうまく使います.
V[\bar{X}]=E[\bar{X}^2]-E[\bar{X}]^2=E[\bar{X}^2]-\mu^2V[\bar{X}]=\displaystyle \frac{\sigma^2}{n}より∴ E[\bar{X}^2]=\displaystyle \frac{\sigma^2}{n}+\mu^2.
\sigma^2の不偏推定量
分散\sigma^2の不偏推定量を考えます.
つまり,サンプルから計算できる推定量で,期待値が真の分散になるものを考えます.
推定量\hat{\theta}が次を満たせば不偏推定量です.
E\left [\hat{\theta}\right ]=\sigma^2
簡単に思いつくのが,真の期待値\muの代わりにサンプル平均を使う次の推定量です.
\displaystyle \frac{1}{n} \displaystyle \sum_{i=1}^{n}(X_i-\bar{X})^2
しかし,これは不偏推定量にはなりません.
分母が割られすぎて,小さくなり過ぎています.
実は分母をn-1とするとうまくいきます.
証明:
E[S^2]=\sigma^2を示す.
(n-1)S^2=\displaystyle \sum_{i=1}^{n}(X_i-\bar{X})^2=\displaystyle \sum_{i=1}^{n}\left \{ (X_i-\mu)-(\bar{X}-\mu) \right \}^2=\displaystyle \sum_{i=1}^{n}(X_i-\mu)^2-2\displaystyle \sum_{i=1}^{n}(X_i-\mu)(\bar{X}-\mu)+\displaystyle \sum_{i=1}^{n}(\bar{X}-\mu)^2=\displaystyle \sum_{i=1}^{n}(X_i-\mu)^2-2(\bar{X}-\mu)\displaystyle \sum_{i=1}^{n}(X_i-\mu)+n(\bar{X}-\mu)^2・・・①
ここで,第2項目は次のように計算できる.-2(\bar{X}-\mu)\displaystyle \sum_{i=1}^{n}(X_i-\mu)=-2(\bar{X}-\mu)\left ( \displaystyle \sum_{i=1}^{n}X_i- \displaystyle \sum_{i=1}^{n}\mu\right )=-2(\bar{X}-\mu)\left ( n\bar{X}-n\mu\right )=-2n(\bar{X}-\mu)^2.①に代入して,(n-1)S^2=\displaystyle \sum_{i=1}^{n}(X_i-\mu)^2-2n(\bar{X}-\mu)^2+n(\bar{X}-\mu)^2=\displaystyle \sum_{i=1}^{n}(X_i-\mu)^2-n(\bar{X}-\mu)^2.よって両辺の期待値をとると,(n-1)E[S^2]=\displaystyle \sum_{i=1}^{n}E\left [ (X_i-\mu)^2\right ]-n E\left [(\bar{X}-\mu)^2\right ]=\displaystyle \sum_{i=1}^{n}V[X]-n V[\bar{X}]=n\sigma^2-n・\displaystyle \frac{\sigma^2}{n}=(n-1)\sigma^2.∴ E[S^2]=\sigma^2.
■
分散の不偏推定量として,もう一つあります.
サンプル平均ではなく,真の期待値\muを使うものです.
この場合,分母はnです.
証明:
E[T^2]=\sigma^2を示す.
E[T^2]=\displaystyle \frac{1}{n}\displaystyle \sum_{i=1}^{n}E\left [(X_i-\mu)^2 \right ]=\displaystyle \frac{1}{n}\displaystyle \sum_{i=1}^{n}\sigma^2=\displaystyle \frac{1}{n}n\sigma^2=\sigma^2.
■