Pay money To my Life

Spend time for myself, and you... "Knowledge was the only way to remember that your past is true"

正規分布の変数変換とその期待値・分散・密度関数

本記事について

(誤植が多いにも関わらず)世代を超えて愛用されている名著"統計学入門"。
一通り本書での勉強(独学)を終え、復習がてらに章末の練習問題を解いていると自分の理解がいかに浅いかを度々感じさせられます。

統計学入門 (基礎統計学Ⅰ)

統計学入門 (基礎統計学Ⅰ)

  • 発売日: 1991/07/09
  • メディア: 単行本

そんな練習問題の中から、単純なことなのに小一時間ハマってしまった問題を解説付きで紹介しようかと思います。わかっている人にとっては

「え?これのどこでハマるの?」

となること間違いありません。世の中にはこんなバカもいるんだよと知ってくれれば。ベローチェのカフェラテを枯らした問題を解いていきます。ちなみに、勉強するカフェはベローチェタリーズコーヒーです。片や安い、片や若者が多い。どちらも捨てがたいですね。環境はダイジです。

ハマった問題

第5章『確率変数』練習問題5.7より

確率変数 Xが、正規分布 \mathscr{N}(0,1)に従うとき、
 {X}^{2}の累積確率分布、密度関数、期待値、分散を求めよ

です。まず最初に、ハマってしまった解答例を。。。その後に、無事に解けた解法を示します。

悪い解き方

 まず初めに、「悪い」とは書きますが、人によっては問題ないのかも。少なくともボクは、この解き方で完全に手が詰まってしまいました。沼の入り口です。

 まず問題から、 X \sim \mathscr{N}(0,1)より、 X確率密度関数 f(x)

 \displaystyle
f(x) = {\frac{1}{\sqrt{2\pi}} e^{ -\frac{x^{2}}{2} } }

であることが分かります。
 求めたいのは X^{2}に関する確率密度関数なので、

 Y = X^{2} \sim g(y)

と置きます。ここで、 g(y)は確率変数 Y確率密度関数であり、本問において求める答えの一つです。ここから、 X Y変数変換します。
変数変換の公式の導出はしませんが、これは

 \displaystyle
g(y) = f(h^{-1}(y)) |(h^{-1})'(y)|

で求められます。ここで、 h(x) = yは、確率変数 Xを確率変数 Yへ変換する数学的な関数であり、 h^{-1}(y)はその逆関数です。
 今回の問題では、 h(x) = x^{2}であるので、 h^{-1}(y) = y^{\frac{1}{2}}と求まります。これを変数変換の公式に代入すると、

 \displaystyle
\begin{eqnarray}
 g(y) &=& f(h^{-1}(y)) |(h^{-1})'(y)|   \\
&=& f(y^{\frac{1}{2}}) | \frac{ y^{ -\frac{1}{2} } }{2} | \\
&=& \frac{1}{\sqrt{2\pi}} e^{ -\frac{ {(y^{ 1/2 })}^{2} }{2} } \frac{1}{2\sqrt{y}} 
\end{eqnarray}

ってな感じに求まります。これが Y=X^{2}確率密度関数です。
 そこから、累積確率分布を算出するために、 g(y)積分 (0 \leq  \alpha)すると、

 \displaystyle
\begin{eqnarray}
 G(y) &=& \int^{\alpha}_{-\infty} \frac{1}{\sqrt{2\pi}} e^{ -\frac{ {(y^{ 1/2 })}^{2} }{2} } \frac{1}{2\sqrt{y}} dy 
\end{eqnarray}

....少なくともボクは、これの積分が解けずに詰みました(いつの日かひょんなことから解けちゃいそうな気もするけど、、、わからない、、、ぴえん)。

 つまりですね、この悪い解法って何が悪いかって、『圧倒的に計算が大変だしこれ以上計算できなくなってしまう』ことなんですね。問題文からしても、先に累積確率分布を算出して、その後に密度関数を算出して、それを使って期待値・分散を算出して、っていう流れが基本なんだと思うんです。きっと。 練習問題前最後のページが変数変換だったのでまんまと引っ張られましたコンチクショウ。
 ただ、勘違いして欲しくないのは、この解き方でも、数学的には間違えていないはずなんです。ただ単に、数学力が足りていないだけです。次に紹介するのは、もっと簡単な解き方です。

解ける解き方(著者の意図)

では、次に実際に解けた解法を紹介します。筆者の考えを汲み取り、累積確率分布から順番に求めていきます(散々センター試験対策で筆者の意図は汲んできた)。
 先ほどと同様に、 X \sim \mathscr{N}(0,1)より、 X確率密度関数 f(x)

 \displaystyle
f(x) = {\frac{1}{\sqrt{2\pi}} e^{ -\frac{x^{2}}{2} } }

であり、

 Y = X^{2} \sim g(y)

とします。すると、 Yの累積確率分布 G(y)

 \displaystyle
\begin{eqnarray}
G(y) &=& P\left(X^{2} \leq y\right) \\
&=& P\left(-\sqrt{y} \leq X \leq \sqrt{y}\right) \\
&=& 2P\left(0 \leq X \leq \sqrt{y}\right) \left(\because X \sim \mathscr{N}(0, 1) \right) \\
&=& 2\Bigl\{  \Phi\left(\sqrt{y}\right) - \Phi\left(0\right) \Bigr\}
 \left(\therefore \Phi(x=a) = \int^{a}_{-\infty}{ \frac{1}{\sqrt{2\pi}} e^{-\frac{x^{2}}{2}} dx} 
\right) \\
&=& 2 \Bigl\{  \Phi\left(\sqrt{y}\right) - \frac{1}{2}  \Bigr\}
\end{eqnarray}

と表されます。 Y確率密度関数 g(y)は、これを微分して、

 \displaystyle
\begin{eqnarray}
g(y) = \Bigl\{G(y)\Bigr\}'  &=& \biggl\{  2 \left(  \Phi\left(\sqrt{y}\right) - \frac{1}{2}  \right)  \biggr\}' \\
&=& 2 \Bigl\{  \Phi \left(\sqrt{y}\right)\Bigr\}'  \cdot  \left(\sqrt{y} \right)'  \\
&=& 2 \frac{1}{\sqrt{2\pi} } e^{ -\frac{\sqrt{y}^{2}}{2} }  \left| \frac{1}{2\sqrt{y}} \right|   \\
&=& \frac{1}{\sqrt{2\pi y} } e^{ -\frac{y}{2} }
\end{eqnarray}

となります。簡単な計算だけで累積確率分布 G(y)確率密度関数 g(y)が得られます。さすがですね、これが筆者の意図ですね。

ここから、 X^{2} = Yの期待値 E[Y]、分散 V[Y]は

 \displaystyle
\begin{eqnarray}

E[Y] = E\bigl[X^{2}\bigr] 
&=& \int^{\infty}_{-\infty}{
                                        x^{2} \frac{1}{\sqrt{2\pi}}  e^{ -\frac{x^{2}}{2} } dx } \\
&=& \frac{1}{\sqrt{2\pi}} \int^{\infty}_{-\infty}{
                                        x^{2}  e^{ -\frac{x^{2}}{2} } dx } \\
&=& \frac{1}{\sqrt{2\pi}} \int^{\infty}_{-\infty}{
                                        x \cdot xe^{ -\frac{x^{2}}{2} } dx } \\
&=& \frac{1}{\sqrt{2\pi}} \biggl\{
                                        \biggl[  x  \cdot  \cfrac{ e^{ -\frac{x^{2}}{2} } }{ -2 \cdot \frac{1}{2} } \biggr]^{\infty}_{-\infty}    -  \int^{\infty}_{-\infty}{ - e^{ -\frac{x^{2}}{2} } dx }
                                        \biggr\} \\
&=& \frac{1}{\sqrt{2\pi}} \biggl\{
                                        0 + \int^{\infty}_{-\infty}{ e^{ -\frac{x^{2}}{2} } dx }
                                        \biggr\} \\
&=& \frac{1}{\sqrt{2\pi}} \sqrt{ \cfrac{\pi}{\frac{1}{2}} }  (\because ガウス積分  )   \\
&=& 1

\end{eqnarray}
 \displaystyle
\begin{eqnarray}

V[Y] = V\bigl[X^{2}\bigr] &=& E\bigl[X^{4}\bigr]  -  \biggl\{E\bigl[X^{2}\bigr]\biggr\}^{2} \\
&=& \int^{\infty}_{-\infty}{
                                        x^{4} \frac{1}{\sqrt{2\pi}}  e^{ -\frac{x^{2}}{2} } dx }   -1 \\
&=& \frac{1}{\sqrt{2\pi}} \int^{\infty}_{-\infty}{
                                        x^{4}  e^{ -\frac{x^{2}}{2} } dx }   -1 \\
&=& \frac{1}{\sqrt{2\pi}} \int^{\infty}_{-\infty}{
                                        x^{3} \cdot xe^{ -\frac{x^{2}}{2} } dx }  -1 \\
&=& 3 \cdot E\bigl[X^{2}\bigr]  -1\\
&=& 3-1 \\
&=& 2

\end{eqnarray}

よって、最終的な答えとしては、

 X \sim \mathscr{N}(0,1)である {X}^{2}において、

累積確率分布  F(x^{2}) = 2 \Bigl\{  \Phi\left(\sqrt{y}\right) - \frac{1}{2}  \Bigr\}、 密度関数  f(x^{2}) = \frac{1}{\sqrt{2\pi y} } e^{ -\frac{y}{2} }
期待値  E\bigl[X^{2}\bigr] = 1、 分散  V\bigl[X^{2}\bigr] = 2

終わりに

 悪い解き方についても、標準正規分布の累積確率分布の形に直せるよ〜と気づければ良かったのですが、あの状態からだと変形して導くは難しかったです。とは言っても、今回の問題にそぐわなかったのと、基本的に数学としては間違えていないはずです。単純に計算力不足。
 ルベーグ積分を勉強している今日この頃なのですが、先が不安になります。ある程度勉強して、微分積分の勘が戻ってきたなら、再度あの積分を解いてしまいましょう。

ルベーグ積分入門―使うための理論と演習

ルベーグ積分入門―使うための理論と演習

ここまで読んでいただき、ありがとうございました。

最後にこの曲を聞いてお別れです。

今年ついに日本中に知られる時なのではないでしょうか。
親心さながら、少し寂しくもありますが。。

(せーのっ)

\\\ かくれんぼ //

AliA「かくれんぼ」MV