統計⑤ ポアソン分布
ポアソン分布の導出と期待値の計算
ポアソン分布は離散的だった二項分布の延長として計算されます。ポアソン分布
ポアソン分布とは?
ポアソン分布
パラメータ$\lambda$に対して、ある期間に平均$\lambda$回起こる事象が実際に起こる回数を表す確率変数を$X$とします。$X$$=k$となる確率は、
\begin{align*}
P(X=k)=\dfrac{e^{-\lambda}\lambda^k}{k!}
\end{align*}
ポアソン分布の導出
前提:二項分布
確率$p$で成功する試行を$n$回繰り返した時に成功する階数を表す確率変数$X$に対して、$X$$=k$となる確率は、\begin{align*}
P(X=k)={}_nC_kp^k(1-p)^{n-k}
\end{align*}
となります。これを前提に、以下、進めていきます。
二項分布からポアソン分布を導出する考え方
二項分布の期待値(以下、$\lambda$とおきます。)は、\begin{align*}
E[X]=np(=\lambda)
\end{align*}
と表されたのでした。(参考:一様分布・ベルヌーイ分布・二項分布)
この$\lambda$を一定に保ったまま、試行回数$n$$\to \infty$とします。このとき、$\lambda$$=np$が有限の値であるためには、$p\to 0$であることが必要になります。
二項分布からポアソン分布を導出する計算
$p$を$\lambda/n$で置き換えます。\begin{align*}
P(X=k)
&=\dfrac{n!}{(n-k)!k!}\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{n-k} \nonumber \\
&=\dfrac{n!}{(n-k)!k!}\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{-\frac{n-k}{\lambda}\cdot (-\lambda)} \nonumber \\
&=\dfrac{n!}{(n-k)!}\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{-k}\cdot \dfrac{1}{k!}\left(1-\dfrac{\lambda}{n}\right)^{-\frac{n}{\lambda}\cdot(-\lambda)} \\
&=\dfrac{n!}{(n-k)!}\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{-k}\cdot \dfrac{1}{k!}\left(1-\dfrac{\lambda}{n}\right)^{-\frac{n}{\lambda}\cdot(-\lambda)} \\
&=n\cdot(n-1)\cdot\ \cdots\ \cdot(n-k+1)\cdot\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{-k}\cdot \dfrac{1}{k!}\left(1-\dfrac{\lambda}{n}\right)^{-\frac{n}{\lambda}\cdot(-\lambda)} \\
&=1\cdot\left(1-\dfrac{1}{n}\right)\cdot\left(1-\dfrac{2}{n}\right)\cdot \left(1-\dfrac{3}{n}\right)\cdot\ \cdots\ \cdot\left(1-\dfrac{k-1}{n}\right)\cdot\lambda^k \left(1-\dfrac{\lambda}{n}\right)^{-k}\cdot \dfrac{1}{k!}\left(1-\dfrac{\lambda}{n}\right)^{-\frac{n}{\lambda}\cdot(-\lambda)}
\end{align*}
今注意すべきなのは、$\lambda$,$k$はあくまで有限の値であり、無限大に飛ばす$n$の前では普通の定数と同様に扱うということです。つまり、$n \gg k$として扱います。
\begin{align*}
1\cdot\left(1-\dfrac{1}{n}\right)\cdot\left(1-\dfrac{2}{n}\right)\cdot \left(1-\dfrac{3}{n}\right)\cdot\ \cdots\ \cdot\left(1-\dfrac{k-1}{n}\right)&\to 1 \\
\left(1-\dfrac{\lambda}{n}\right)^{-k}&\to 1
\end{align*}
ということです。また、自然対数の底の定義(を少し変形した)
\begin{align*}
\lim_{x\to 0}\left(1-x\right)^{-\frac{1}{x}}=e
\end{align*}
をもちいて、$x$$=\lambda/n$とおくと、$n$$\to\infty$で、$x$$\to 0$となり、
\begin{align*}
\left(1-\dfrac{\lambda}{n}\right)^{-\frac{n}{\lambda}\cdot(-\lambda)}
=\left\{\left(1-x\right)^{-\frac{1}{x}}\right\}^{-\lambda}
\to e^{-\lambda}
\end{align*}
となります。つまり、求めたい結論の式
\begin{align*}
P(X=k)=\dfrac{e^{-\lambda}\lambda^k}{k!}
\end{align*}
が得られます。
ポアソン分布の期待値
ポアソン分布の期待値を定義に沿って計算します。\begin{align*}
E[X]
&=\sum_{k=0}^\infty k P(X=k) \\
&=\sum_{k=0}^\infty k\dfrac{e^{-\lambda}\lambda^k}{k!} \\
&=\sum_{k=1}^\infty k\dfrac{e^{-\lambda}\lambda^k}{k!} \\
&=\sum_{k=1}^\infty \dfrac{e^{-\lambda}\lambda^k}{(k-1)!} \\
&=\sum_{k=0}^\infty \dfrac{e^{-\lambda}\lambda^{k+1}}{k!} \\
&=\lambda\sum_{k=0}^\infty \dfrac{e^{-\lambda\lambda}}{k!} \\
&=\lambda \sum_{k=0}^\infty P(X=k) \\
&=\lambda
\end{align*}
となります。
ポアソン分布の分散
分散の定義を少し直した以下の式を計算します。\begin{align*}
V[X]=E[X^2]-\{E[X]\}^2
\end{align*}
第二項は先ほどの期待値の計算結果から、第一項について計算すると、
\begin{align*}
E[X^2]
&=\sum_{k=0}^\infty k^2P(X=k) \\
&=\sum_{k=0}^\infty \left\{k(k-1)+k\right\}\dfrac{e^{-\lambda}\lambda^k}{k!} \\
&=\sum_{k=0}^\infty k(k-1)\dfrac{e^{-\lambda}\lambda^k}{k!}+\sum_{k=0}^\infty k\dfrac{e^{-\lambda}\lambda^k}{k!}
\end{align*}
ここで、第二項は$E[X]$です。第一項について計算を進めますが、計算方法は期待値の時と同様で、
\begin{align*}
(\text{第一項})
&=\sum_{k=0}^\infty k(k-1)\dfrac{e^{-\lambda}\lambda^k}{k!} \\
&=\sum_{k=2}^\infty k(k-1)\dfrac{e^{-\lambda}\lambda^k}{k!} \\
&=\sum_{k=2}^\infty\dfrac{e^{-\lambda}\lambda^k}{(k-2)!} \\
&=\sum_{k=0}^\infty\dfrac{e^{-\lambda}\lambda^{k+2}}{k!} \\
&=\lambda^2\sum_{k=0}^\infty\dfrac{e^{-\lambda}\lambda^k}{k!} \\
&=\lambda^2\sum_{k=0}^\infty P(X=k) \\
&=\lambda^2
\end{align*}
よって、
\begin{align*}
E[X^2]=\lambda^2+\lambda
\end{align*}
つまり、
\begin{align*}
V[X]&=E[X^2]-\{E[X]\}^2 \\
&=(\lambda^2+\lambda)-\lambda^2 \\
&=\lambda
\end{align*}
となります。