統計④ 一様分布・ベルヌーイ分布・二項分布
一様分布・ベルヌーイ分布・二項分布とは?
すべての分布の紹介で、離散型確率変数の場合には取りうる値に番号を付けて、$0$から$n$まで、連続型確率変数の場合は定義域を$[a,b]$にします。一様分布とは?
一様分布とはどの値に関しても取る値が等しいということです。一様分布・連続型変数の場合
密度関数の表式
確率変数密度関数が以下のようになります。\begin{align*}
f(x)=\dfrac{1}{b-a}
\end{align*}
これを全定義域で積分すれば、
\begin{align*}
\int_a^bf(x)dx=1
\end{align*}
となります。
期待値の計算
期待値は密度関数に$x$をかけて積分すればよくて、\begin{align*}
E[X]
&=\int_a^b xf(x)dx \\
&=\left[\dfrac{1}{2(b-a)}x^2\right]^b_a \\
&=\dfrac{a+b}{2}
\end{align*}
となります。
分散の計算
分散$V[X]$を計算します。上で計算した期待値の結果を利用して、\begin{align*}
V[X]
&=E[X^2]-\{E[X]\}^2 \\
&=\int_a^b x^2f(x)dx-\left(\int_a^b xf(x)dx\right)^2 \\
&=\dfrac{1}{b-a}\int_a^b x^2 dx-\left(\dfrac{a+b}{2}\right)^2 \\
&=\dfrac{1}{b-a}\dfrac{b^3-a^3}{3}-\dfrac{(a+b)^2}{4} \\
&=\dfrac{1}{b-a}\dfrac{(b-a)(a^2+ab+b^2)}{3}-\dfrac{(a+b)^2}{4} \\
&=\dfrac{a^2+ab+b^2}{3}-\dfrac{a^2+2ab+b^2}{4} \\
&=\dfrac{a^2-2ab+b^2}{12} \\
&=\dfrac{(b-a)^2}{12}
\end{align*}
一様分布・離散型変数の場合
$X=x_i$となる確率は以下のようになります。\begin{align*}
P(X=x_i)=\dfrac{1}{n}
\end{align*}
つまり、すべての取りうる状態の確率が等しいということです。
ベルヌーイ分布とは?
一様分布の時とは、見方が少し変わるのですが、確率変数$X$は、0か1かしかとりません。確率$p$で$X$$=1$となります。ベルヌーイ分布の期待値の計算
期待値は、\begin{align*}
E[X]=0\cdot (1-p)+1\cdot p= p
\end{align*}
ベルヌーイ分布の分散の計算
分散は\begin{align*}
V[X]
&=E[X^2]-\{E[X]\}^2 \\
&=\{0^2\cdot (1-p)+1^2\cdot p\}-p^2 \\
&=p-p^2=p(1-p)
\end{align*}
となります。
二項分布とは?
二項分布とは、ベルヌーイ試行(ベルヌーイ分布に従う試行)を$n$回行ったときに成功する回数の確率変数$X$が従う確率分布です。二項分布の式
$n$回ベルヌーイ試行を行った場合に$x$回成功する確率は、\begin{align*}
P(X=x)={}_nC_xp^x(1-p)^{n-x}
\end{align*}
ただし、$x$は0から$n$までの整数です。
期待値の計算
期待値の計算を行います。ただし、ここでは二項定理\begin{align*}
(a+b)^n ={}_nC_0 a^n b^0+{}_nC_1a^{n-1}b^1+\cdots+{}_nC_n a^0b^n=\sum_{x=0}^n {}_nC_x a^xb^{n-x}
\end{align*}
を用います。
\begin{align*}
E[X]
&=\sum_{x=0}^n x\cdot P(X=x) \\
&=\sum_{x=0}^n x\cdot{}_nC_xp^x(1-p)^{n-x} \\
&=\sum_{x=1}^n x\cdot{}_nC_xp^x(1-p)^{n-x} \\
&=\sum_{x=1}^n x\cdot \dfrac{n!}{(n-x)!x!}p^x(1-p)^{n-x} \\
&=\sum_{x=1}^n \dfrac{n!}{(n-x)!(x-1)!}p^x(1-p)^{n-x} \\
&=n\sum_{x=1}^n \dfrac{(n-1)!}{(n-x)!(x-1)!}p^x(1-p)^{n-x} \\
&=np \sum_{x=1}^n {}_{n-1}C_{x-1}p^{x-1}(1-p)^{n-x} \\
&=np\sum_{x=0}^{n-1} {}_{n-1}C_{x}p^x(1-p)^{n-1-x} \\
&=np\{p+(1-p)\}^{n-1} \\
&=np
\end{align*}
分散の計算
\begin{align*}
V[X]=E[X^2]-\{E[X]\}^2
\end{align*}
を用いて分散を計算するのですが、第二項は先ほど計算した期待値の結果を用いればよいですが、第一項についてはまた同じような計算をしてやる必要があります。ここでは$x^2$をうまく処理しなければなりません。
\begin{align*}
E[X^2]
&=\sum_{x=0}^n x^2 P(X=x) \\
&=\sum_{x=0}^n\{x(x-1)+x\}P(X=x) \\
&=\sum_{x=0}^n x(x-1)P(X=x)+\sum_{x=0}^n xP(X=x) \\
&=\sum_{x=0}^n x(x-1)\cdot {}_nC_xp^x(1-p)^{n-x}+E[X]
\end{align*}
第一項について、
\begin{align*}
\sum_{x=0}^n x(x-1)\cdot {}_nC_xp^x(1-p)^{n-x}
&=\sum_{x=2}^n x(x-1)\cdot {}_nC_xp^x(1-p)^{n-x} \\
&=\sum_{x=2}^n x(x-1)\cdot \dfrac{n!}{x!(n-x)!}p^x(1-p)^{n-x} \\
&=\sum_{x=2}^n \dfrac{n!}{(x-2)!(n-x)!}p^x(1-p)^{n-x} \\
&=n(n-1)\sum_{x=2}^n \dfrac{(n-2)!}{(x-2)!(n-x)!}p^x(1-p)^{n-x} \\
&=n(n-1)\sum_{x=2}^n {}_{n-2}C_{x-2} p^x(1-p)^{n-x} \\
&=n(n-1)p^2\sum_{x=0}^{n-2} {}_{n-2}C_{x}p^x(1-p)^{n-2-x} \\
&=n(n-1)p^2\{p+(1-p)\}^{n-2} \\
&=n(n-1)p^2
\end{align*}
なので、
\begin{align*}
E[X^2]=n(n-1)p^2+np
\end{align*}
となります。よって、分散は、
\begin{align*}
V[X]
&=E[X^2]-\{E[X]\}^2 \\
&=n(n-1)p^2+np-(np)^2 \\
&=-np^2+np \\
&=np(1-p)
\end{align*}
長い計算でした...この二項分布は次回の記事でポアソン分布を導入する際に用います。