ポアソン分布と指数分布の使いどころ


ポアソン分布と指数分布は統計学でよく出てきます.これらはどんな時に使う分布なのかをまとめました.

例題

次のような例題を考えます.

例題1あなたはたい焼き屋の経営者です.
今までのデータから,1時間に平均10個のたい焼きが売れることが分かっています.
なるべく出来立て提供したいあなたは,余裕をみて1時間あたり15個のたい焼きを用意したとします.では,1時間あたり16個以上注文が来てしまう確率はどのくらいでしょうか?

例題2たった今,ストックであるたい焼きが全て売り切れてしまいました.あなたはすぐに次のたい焼きを焼こうとします.

出来上がるのに5分ほど.次の注文が入るのは今からどのくらい後でしょうか?

ポアソン分布と指数分布の使いどころ

ある瞬間にたい焼きが売れる個々の確率は分かりませんが,単位時間(1時間)あたりでは平均の数は分かっています.

「たい焼きが売れる」という”イベント”に関して,単位時間あたりのイベントの発生回数に着目する確率分布がポアソン分布です.

ポアソン分布$$Po(x) = \displaystyle \frac{\lambda^x}{x!}e^{-\lambda}$$

イベントの発生する間隔に着目する確率分布が指数分布です.

指数分布$$f(x) = \lambda e ^{-\lambda x}(x \geq 0)$$

指数分布の分布関数は$$F(x)=\int_{0}^{x}f(x)dx=1-e^{-\lambda x}$$

ポアソン分布は回数に着目するので,離散分布です.指数分布は間隔という時間に着目するので連続分布です.

ポアソン分布の仕組み

確率の基本は二項分布です.
二項分布は成功確率pである事象をn回試行した際の成功回数kの確率分布です.
$$B(n,p)={}_n \mathrm{C}_k p^k(1-p)^{n-k}$$
上の例題の場合でいう確率pはある瞬間に事象が発生する確率となりますが,それは分かっていません.分かっているのは,平均値$$\lambda = np$$だけです.ここで,\(n\)は試行回数なので,全体で見れば\(\infty\)回の試行と考えられます.よって$$p = \displaystyle \frac{\lambda}{n}$$として\(n \to \infty\)とすれば二項分布は次のように変形できます.

\({}_n \mathrm{C}_x p^x(1-p)^{n-x} = \displaystyle \frac{n(n-1)\cdots (n-x-1)}{x!}\left ( \frac{\lambda}{n} \right )^x \left (1-\displaystyle \frac{\lambda}{n} \right )^{n-x}\)
\(=1 \left ( 1 – \displaystyle \frac{1}{n} \right ) \left ( 1 – \displaystyle \frac{2}{n} \right ) \cdots \left ( 1 – \displaystyle \frac{x-1}{n} \right )\displaystyle \frac{\lambda^x}{x!} \left (1-\displaystyle \frac{\lambda}{n} \right )^n \left (1-\displaystyle \frac{\lambda}{n} \right )^{-x}\)
ここで,\(\left (1-\displaystyle \frac{\lambda}{n} \right )^n = \left \{ \left (1-\displaystyle \frac{\lambda}{n} \right )^{\displaystyle -\frac{n}{\lambda}} \right \} ^{-\lambda}\)\( \to e^{-\lambda}(n \to \infty)\)より
\({}_n \mathrm{C}_x p^x(1-p)^{n-x} \to \displaystyle \frac{\lambda^x}{x!}e^{-\lambda} (n \to \infty).\)

このように,試行回数\(n\),確率\(p\)を使わずに確率分布を定めることができました.

指数分布に関しては,積分を使って厳密に示したいので別の機会にします.

例題の考察

単位時間(1時間)あたりの平均は10人なので,\(\lambda = 10\)です.

まずポアソン分布に当てはめて,1時間あたり\(x\)個売れる確率の分布を計算します.

すると,\(x=15\)個までの累積確率が95%と分かりました.
16個以上となる確率は5%未満で,15個用意しておけば1時間は95%の確率で問題ないと言えます.

次に時間間隔で考えると,1時間あたり10個なので,1個あたり\(\frac{60}{10}=6\)分毎に売れるとして指数分布を計算します.

ある瞬間から次に売れるのが5分以内である確率は56%だと分かります.

さいごに

以前私は会社で,ある製品が故障する確率はどのくらいか相談されたことがあります.

めったに故障するものではなく,数年に1回程度だったので,単位年あたりの平均を求めてポアソン分布で故障率を説明しました.

数学を勉強しているときはあまり意識していませんが,実社会に役立つと嬉しいものです.

==================================

にほんブログ村ランキングに参加しています.

クリックで応援よろしくお願いします.

にほんブログ村 科学ブログ 数学へ

にほんブログ村

==================================

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です