【統計学】ポアソン分布とは 定義と性質まとめ【証明】

ポアソン分布 統計学

ポアソン分布とは発生する頻度が低い事象が何回発生するか、その確率を求める為に利用されます。
具体的には、交通事故が発生する回数、大量生産の不良品の数、サッカーの試合で単位時間当たりのゴール数などがポアソン分布に従うと言われています。

確率質量関数\( \displaystyle f(k) = \frac{e^{-\lambda} \lambda^k}{k!} \)
平均値\( \lambda \)
分散\( \lambda \)

定義

ポアソン分布は、二項分布から応用されて作られた関数です。
二項分布の確率質量関数は以下となります。
$$ f(k | n,p) = \begin{pmatrix}n\\k\end{pmatrix} p^k (1-p)^{n-k} $$

ここで、\( n \)が大きく\( p \)が小さいとき、すなわち大量の観察で稀少な現象が発生するときを考えます。

たとえば、大量生産において不良品が作られる確率が極めて小さい\( p=0.002 \)とします。
\( n=1000 \)個作成した時の不良品が\( 3 \)個となる確率は、\( \displaystyle \begin{pmatrix}1000\\3\end{pmatrix} (0.002)^3 (0.998)^{997} \)となります。
この計算を直接計算することは現実的ではありません。
しかし、このときの平均値は\( np = 2 \)であるから、\(k = 0, 1, 2, 3\)の確率は小さくないことが分かります。
この計算には以下の定理が使えます。

ポアソンの小数の法則

\( np = \lambda\) としたとき、 \( n \rightarrow \infty, \, p \rightarrow 0 \)の極限について、
$$ \begin{pmatrix}n\\k\end{pmatrix} p^k (1-p)^{n-k} \longrightarrow \frac{e^{-\lambda} \lambda^k}{k!} $$が成り立つ。

証明

\( np=\lambda \)を利用して、二項分布の確率質量関数を式変形する。
$$ \begin{eqnarray*} \begin{pmatrix}n\\k\end{pmatrix} p^k (1-p)^{n-k} &=& \frac{n(n-1) \cdots (n-k+1)}{k!} \left( \frac{\lambda}{n} \right)^k \left( 1 – \frac{\lambda}{n} \right)^{n-k} \\ &=& \frac{n}{n} \frac{n-1}{n} \cdots \frac{n-k+1}{n} \frac{\lambda^k}{k!} \left( 1 – \frac{\lambda}{n} \right)^{n-k} \end{eqnarray*}$$ここで、\( n \rightarrow \infty \)のとき、指数関数の極限から、
$$ \begin{pmatrix}n\\k\end{pmatrix} p^k (1-p)^{n-k} \longrightarrow \frac{e^{-\lambda} \lambda^k}{k!} $$が成り立つ。

ポアソンの少数の法則における極限が、ポアソン分布の確率質量関数となります。

ポアソン分布の確率質量関数

一定の期間中に平均で\( \lambda \)回発生する事象がちょうど\( k \)回発生する確率をポワソン分布といい、\( Po(\lambda) \)と書く。
\( Po(\lambda) \) の確率質量関数は、以下となる。
$$ f(k) = \frac{e^{-\lambda} \lambda^k}{k!} $$

ポアソン分布\( Po(\lambda) \)のグラフ
ポアソン分布が確率分布であることの証明

指数関数のテイラー展開\( \displaystyle e^x = \sum_{i=0}^\infty \frac{x^i}{i!} \)を用いて、
$$ \sum_{i=0}^\infty f(i) = \sum_{i=0}^\infty \frac{e^{-\lambda} \lambda^i}{i!} = e^{-\lambda} \sum_{i=0}^\infty \frac{\lambda^i}{i!} = e^{-\lambda} \cdot e^\lambda = 1 $$

平均値

ポアソン分布\( Po(\lambda) \)の平均値は\( \lambda \)である。

証明

確率変数\( X \)が\( Po(\lambda) \)に従うとする。このとき、平均値\( E[X] \)を計算すると、
$$ \begin{eqnarray*} E[X] &=& \sum_{i=0}^\infty if(i) = \sum_{i=0}^\infty \frac{ie^{-\lambda} \lambda^i}{i!} = \lambda e^{-\lambda} \sum_{i=0}^\infty \frac{\lambda^{i-1}}{(i-1)!} \\ &=& \lambda e^{-\lambda} \cdot e^\lambda = 1 \end{eqnarray*} $$

分散

ポアソン分布\( Po(\lambda) \)の分散は\( \lambda \)である。

証明

確率変数\( X \)が\( Po(\lambda) \)に従うとする。このとき、平均値\( E[X^2] \)を計算する。
$$ \begin{eqnarray*} E[X^2] &=& \sum_{i=0}^\infty i^2 f(i) = \sum_{i=0}^\infty i^2 \frac{e^{-\lambda} \lambda^i}{i!} = \sum_{i=0}^\infty \{ i(i-1) + i \} \frac{e^{-\lambda} \lambda^i}{i!} \\ &=& \lambda^2 e^{-\lambda} \sum_{i=0}^\infty \frac{\lambda^{i-2}}{(i-2)} + \lambda e^{-\lambda} \sum_{i=0}^\infty \frac{\lambda^{i-1}}{(i-1)} \\ &=& \lambda^2 e^{-\lambda} \cdot e^\lambda + \lambda e^{-\lambda} \cdot e^\lambda = \lambda^2 + \lambda \end{eqnarray*} $$以上より、\( V[X] \)を計算すると、
$$ V[X] = E[X^2] \, – E[X]^2 = \lambda^2 + \lambda \, – \lambda^2 = \lambda $$

再生性

確率変数\( X_1, X_2 \)がそれぞれポアソン分布\( Po(\lambda_1), Po(\lambda_2) \)に従い、独立であるとする。
このとき、\( X_1 + X_2 \)は\( Po(\lambda_1 + \lambda_2) \)に従う。

証明

\( X_1, X_2 \)が独立であることから、
$$ \begin{eqnarray*} P(X_1 + X_2 = n) &=& \sum_{i=0}^n f(i) f(n-i) \\ &=& \sum_{i=0}^{n} \frac{\lambda_1^i e^{-\lambda_1}}{i!} \cdot \frac{\lambda_2^{n-i}e^{-\lambda_2}}{(n-i)!} \\ &=& \frac{e^{-(\lambda_1 + \lambda_2)}}{n!} \sum_{i=0}^{n} \begin{pmatrix}n\\i\end{pmatrix} \lambda_1^i \lambda_2^{n-i} \\ &=& \frac{e^{-(\lambda_1 + \lambda_2)}(\lambda_1 + \lambda_2)^n}{n!} \end{eqnarray*} $$したがって、\( X_1 + X_2 \)は\( Po(X_1+X_2) \)に従う。

タイトルとURLをコピーしました