統計⑦ 正規分布
正規分布とは?
正規分布について紹介します。正規分布の確率密度関数
正規分布の確率密度関数
正規分布の確率密度関数$f(x)$は平均値を$\mu$、分散を$\sigma^2$として、以下のようにあらわされます。
\begin{align*}
f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}
\end{align*}
確率密度関数を積分して1になるか?
確率密度関数を全範囲で積分します。\begin{align*}
\int_{-\infty}^\infty f(x)dx
&=\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx
\end{align*}
さて、この右辺の計算ですが、これはガウス積分を用いて計算します。まず、$x-\mu=s$と置換すると、$dx=ds$であり、積分範囲は元の範囲と同じように、$-\infty$から$\infty$になります。
\begin{align*}
=\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty e^{-\frac{s^2}{2\sigma^2}}ds
\end{align*}
ここで、ガウス積分の公式
\begin{align*}
\int_{-\infty}^\infty e^{-ax^2}dx=\sqrt{\dfrac{\pi}{a}}
\end{align*}
をもちいると、(参考:ガウス積分)
\begin{align*}
\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty e^{-\frac{s^2}{2\sigma^2}}ds
=\dfrac{1}{\sqrt{2\pi}\sigma}\sqrt{2\pi\sigma^2}=1
\end{align*}
正規分布の期待値(平均値)
正規分布の期待値\begin{align*}
E[X]=\int_{-\infty}^\infty xf(x)dx
\end{align*}
を計算します。ちなみに、確率密度関数の中で、平均値が$\mu$と指定してあるので、それが出てくる、というだけですがね。右辺に確率密度関数の具体的な式を代入すると、
\begin{align*}
\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty xe^{-\frac{(x-\mu)^2}{2\sigma^2}}dx
\end{align*}
先ほどと同様に、$x-\mu$$=s$と置換すると、
\begin{align*}
=\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty (s+\mu)e^{-\frac{s^2}{2\sigma^2}}ds
\end{align*}
さて、$se^{-\frac{s^2}{2\sigma^2}}$は奇関数なので、積分すると0になり、第二項について、またガウス積分の公式を用いると、
\begin{align*}
&=\dfrac{\mu}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty e^{-\frac{s^2}{2\sigma^2}}ds\\
&=\dfrac{\mu}{\sqrt{2\pi}\sigma}\sqrt{2\pi\sigma^2} \\
&=\mu
\end{align*}
正規分布の分散
分散も正規分布の式の中に出てきているので、それが計算結果に降りてくることを確かめます。\begin{align*}
V[X]=\int_{-\infty}^\infty (x-\mu)^2f(x)dx=\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx
\end{align*}
先ほどと同様に、$x-\mu$$=s$と置換すると、$ds=dx$であり、
\begin{align*}
=\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty s^2e^{-\frac{s^2}{2\sigma^2}}ds
\end{align*}
ここで、ガウス積分の公式を用います。今回用いる公式は、
\begin{align*}
\int_{-\infty}^\infty x^ne^{-ax^2}dx&=I_n(a)\text{とおいて、}(a\gt 0) \\
\dfrac{d}{da}I_n(a)&=-I_{n+2}(a) \\
I_0(a)&=\sqrt{\dfrac{\pi}{a}}
\end{align*}
というものです。(これもガウス積分の記事で紹介してあります) ここで、$I_2(a)$を求めます。
\begin{align*}
I_2(a)=-\dfrac{d}{da}I_0(a)=\dfrac{1}{2}\sqrt{\dfrac{\pi}{a^3}}
\end{align*}
というわけで、
\begin{align*}
\dfrac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^\infty s^2e^{-\frac{s^2}{2\sigma^2}}ds
&=\dfrac{1}{\sqrt{2\pi}\sigma}I_2(1/2\sigma^2) \\
&=\dfrac{1}{\sqrt{2\pi}\sigma}\dfrac{1}{2}\sqrt{8\sigma^6\pi} \\
&=\sigma^2
\end{align*}
となり、分散が出てきますね。