正規分布の導出と基本事項


正規分布は,平均値付近にデータが集まっており,左右対称な連続確率分布です.
正規分布の納得いく導出(個人的理解)から,標準化,基本事項,モーメント母関数による平均,分散の計算までをまとめます.

標準正規分布の導出(個人的理解)

ある事象がどれだけ起こるのか確率的な分布を知りたいとする.例えば、身長は170センチを中心になっていると考えられ,200センチを超える人や140センチを下回る人は稀であろう.そういう考えのもと,平均\(\mu=0\)を中心に左右対称な分布を作りたい.

(注意)実際には,様々な経緯を沿って,今の形になっていると思われるが,あくまで個人的に納得のいく導出となっております.

さて,求めたい連続確率分布の条件を次のように設定する.
条件:
(1) \(0\)を中心に左右対称な分布
(2) 左右は急速に\(0\)に漸近する
(3) 確率分布の条件\(-\infty < x < +\infty\)の積分で\(1\)

これらをうまく満たす関数であれば何でもよい.

とりあえず次の関数を考える.$$f(x)=\frac{1}{x^2}$$

この関数では左右対称だが,\(x=0\)で定義されない.

 

 

 

では,\(x=0\)で不定にならないように,次の関数を考える.$$f(x)=\frac{1}{x^2+1}$$

 

条件(1)は満たしているが,条件(2)の急減少が弱い.

 

では,急減少させるために,指数関数を導入する.$$f(x)=a^{-x^2}$$ここで,\(a\)は正の実数とする.

いい感じに条件(1),条件(2)を満たしている.

 

ここで,\(A=\log a\)とおき,ネイピア数\(e\)で次のように式を変形しておく.$$f(x)=a^{-x^2}$$$$=e^{-x^2 \log a}$$$$=e^{-Ax^2}$$

ここで,ガウス積分より,$$\int_{-\infty}^{\infty} e^{-Ax^2} dx = \sqrt{\frac{\pi}{A}}$$

よって,条件(3)を満たすために,係数として,\(\displaystyle \sqrt{\frac{A}{\pi}}\)をかけて,$$f(x) = \sqrt{\frac{A}{\pi}} e^{-Ax^2}$$

ここで,実数\(a\)は任意だったため,天下り的だが,\(a=\sqrt{e}\)とすれば,\(A = \log a = \displaystyle \frac{1}{2}\)となり,$$f(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}}$$を得る.

これが,標準正規分布である.

変数変換による正規分布の導出

変数変換として,\(z=\displaystyle \frac{x-\mu}{\sigma}\)とする.$$dz = \frac{1}{\sigma}dx$$より,$$\int_{-\infty}^{\infty}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx$$$$=\int_{-\infty}^{\infty}e^{-\frac{z^2}{2}}\sigma dz$$$$=\sqrt{2\pi}\sigma$$$$∴ f(x) = \frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$

これが,正規分布である.

後ほどモーメント母関数を用いて証明するが,平均が\(\mu\),分散が\(\sigma^2\)となっている.

標準正規分布の基本

標準正規分布について,次は覚えておいが方がよいです.

\(\pm\sigma\)信頼区間の確率(1) \(\pm 1 \sigma\)範囲は約68%で起こる確率
(2) \(\pm 3 \sigma\)範囲は千に3つ(99.7%)
95%,99%信頼区間のp値(1) 95%信頼区間は\(\pm\)1.96
(2) 99%信頼区間は\(\pm\)2.575

モーメント母関数による平均,分散の導出

では,正規分布の平均と分散をモーメント母関数を用いて計算します.

定義(モーメント母関数)$$M(\theta)=E[e^{\theta X}]=\int_{-\infty}^{\infty}e^{\theta x}f(x)dx$$
公式$$(1) 期待値E[X]=M^{\prime}(0)$$$$(2) 分散V[X]=M^{\prime \prime}(0)-M^{\prime}(0)^2$$
定理(正規分布のモーメント母関数)$$M(\theta)=e^{\mu\theta+\frac{\sigma^2\theta^2}{2}}$$

定理の証明:
指数部分が小さくなってしまうので\(e^x=\exp\left \{ x \right \}\)を用います.$$M(\theta)=E[e^{\theta X}]=\int_{-\infty}^{\infty}e^{\theta x}f(x)dx$$$$=\int_{-\infty}^{\infty} \exp\left \{ \theta x \right \} \cdot\frac{1}{\sqrt{2\pi} \sigma} \exp\left \{ -\frac{(x-\mu)^2}{2\sigma^2} \right \}dx$$$$=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty}\exp\left \{ -\frac{(x-\mu)^2}{2\sigma^2}+\theta x\right \}dx$$ここで,指数部分を$$g(x)=-\frac{(x-\mu)^2}{2\sigma^2}+\theta x$$とおく.$$g(x)=-\frac{1}{2\sigma^2}\left \{(x-\mu)^2-2\sigma^2\theta x\right \}$$$$=-\frac{1}{2\sigma^2}(x^2-2\mu x+\mu^2-2\sigma^2\theta x)$$$$=-\frac{1}{2\sigma^2}\left \{x^2-2(\mu+\sigma^2\theta )x+\mu^2\right \}$$$$=-\frac{1}{2\sigma^2}\left (\left \{x-(\mu+\sigma^2\theta )\right \}^2-(\mu+\sigma^2\theta )^2+\mu^2\right )(平方完成)$$ここで,\(\mu^{\prime}=\mu+\sigma^2\theta\)とおくと,$$=-\frac{(x-\mu^{\prime})^2}{2\sigma^2}+\frac{1}{2\sigma^2}\left ((\mu+\sigma^2\theta )^2-\mu^2\right )$$$$=-\frac{(x-\mu^{\prime})^2}{2\sigma^2}+\mu\theta+\frac{\sigma^2\theta^2}{2}.$$よって,$$M(\theta)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty}\exp\left \{-\frac{(x-\mu^{\prime})^2}{2\sigma^2}+\mu\theta+\frac{\sigma^2\theta^2}{2}\right \}dx$$$$=\exp\left \{\mu\theta+\frac{\sigma^2\theta^2}{2}\right \}\cdot\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty}\exp\left \{-\frac{(x-\mu^{\prime})^2}{2\sigma^2}\right \}dx.$$ガウス積分より,$$\int_{-\infty}^{\infty}\exp\left \{-\frac{(x-\mu^{\prime})^2}{2\sigma^2}\right \}dx=\sqrt{2\pi}\sigma$$なので,$$M(\theta)=e^{\mu\theta+\frac{\sigma^2\theta^2}{2}}.$$

以上より,正規分布のモーメント母関数が,$$M(\theta)=e^{\mu\theta+\frac{\sigma^2\theta^2}{2}}$$であることが分かりました.

これを微分することで,期待値と分散を計算できます.

$$M^{\prime}(\theta)=(\mu+\sigma^2\theta)e^{\mu\theta+\frac{\sigma^2\theta^2}{2}},$$$$M^{\prime\prime}(\theta)=\sigma^2e^{\mu\theta+\frac{\sigma^2\theta^2}{2}}+(\mu+\sigma^2\theta)^2e^{\mu\theta+\frac{\sigma^2\theta^2}{2}}.$$∴$$期待値E[X]=M^{\prime}(0)=\mu.$$$$分散V[X]=M^{\prime \prime}(0)-M^{\prime}(0)^2=\sigma^2+\mu^2-\mu^2=\sigma^2.$$

以上より,正規分布\(f(x)=\displaystyle \frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{\sigma^2}}\)の平均が\(\mu\),分散が\(\sigma^2\)となっていることが分かりました.

==================================

にほんブログ村ランキングに参加しています.

クリックで応援よろしくお願いします.

にほんブログ村 科学ブログ 数学へ

にほんブログ村

==================================

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です