すーがくをがくすー

中の人は情報通信工学専攻です。専攻がらみの数学・物理(特に院試のネタになりそうなもの)を扱う予定。

〔確率論〕逆関数法による確率分布の生成

 区間  [ 0, 1 ] 上の一様分布に従う確率変数  X から, 任意の確率分布(に従う乱数)を生成する逆関数法を, 定理を覚えることなく使用するための手法について, 問題を通して扱ってみる。


(問題)

問 題

 区間  [ 0, 1 ] 上の一様分布に従う確率変数  X から, 確率密度関数

 \displaystyle
p(x) = \frac{2}{\pi (e ^ x + e ^ {-x})} 
\tag{1}
 

に従う確率変数  f(X) を生成する。このとき,  f を定めよ。



(概観)

 個人的に確率論・統計論は「門戸が広く, 奥も深い」というイメージを持っている。確率変数一つとっても, その厳密な定義にはルベーグ積分に端を発する測度論に踏み込まなければならず, 「掴めた!」という感覚を得にくい分野の一つだろう。あくまで確率に全く精通していない個人の主観だが。

 さて, まずは本問の意味するところを,  p(x) の累積分布関数を  F(x) = P(Y \leq x) とし, 数式に置き換えてみる(ここで, 与えられた密度関数  p(x) に従う確率変数を  Y としている)。すると, 本問は

 \displaystyle
P(f(X) \leq a) = F(a) \tag{2}

が成立するような関数  f を定めよ, と述べている。


 次に,  (2) の左辺に注目しよう。いま,  X の従う確率分布は  [ 0, 1 ] 上の一様分布, と明確に与えられている。であれば,  (2) の左辺の ( ) の内部において,  X が陽に現れるようにうまく変形したい。そこで,  f(X) \leq a において両辺  f逆関数を作用させることを考える。


 しかし, 安易に両辺逆関数をとるわけにはいかない。なぜなら, 不等号の向きがどうなるかに関する議論が必要となるからだ。あるいは, 逆関数そのものの存在が言えるかどうかも分かっていない。

 ここで大きく効いてくるのは, 一般論として, 関数  f が「(連続な)単調増加関数」であるとき, (厳密な証明は省略するが)

「( f が単調増加) ⇒ ( f^{-1} が存在)」

「( f が単調増加) ⇒ ( f^{-1} が単調増加)」

がどちらも保証される, という事実である。これは以下の図を見ればほぼほぼ明らかであろう。

単調増加関数

本問において, これらの成立は非常に都合が良い。そこで,  f が単調増加関数であるという仮定のもと, 両辺の逆関数をとってみる。すると, 以下のようになる。

 \displaystyle
P(X \leq f ^ {-1} (a)) = F(a) \tag{3}

  X区間  [ 0, 1 ] 上の一様分布に従うという仮定から, 左辺の値はそのまま  f ^ {-1} (a) となる。ということは,  f逆関数の形が分かったので,  f = F ^ {-1} が言えるのである。最後に, 実際に  F が累積分布関数であるという仮定から,  F ^ {-1} が存在して, かつそれが単調増加関数である。よって,  f に課した「単調増加関数」という仮定は適当であったことも分かる。


 以上に留意すれば, 逆関数法の定理を忘れてしまっても, 以下の解答のようにしていちから  f を生成することが出来るだろう。

(解答)

[1] 与えられた密度関数の累積分布を求める

   p(x) の累積分布関数  F(x) を求める。定義より,

 \displaystyle
F(x) = 
\int _ {- \infty} ^ {x} p(t) dt
 \displaystyle
= \frac{2}{\pi}
\int _ {- \infty} ^ {x} \frac{1}{e ^ t + e ^ {-t}} dt
 \displaystyle
= \frac{2}{\pi}
\int _ {0} ^ {e ^ x} \frac{1}{u + \frac{1}{u}} \frac{du}{u}
 u = e ^ t と変数変換)
 \displaystyle
= \frac{2}{\pi}
\int _ {0} ^ {e ^ x} \frac{1}{u ^ 2 + 1} du
 \displaystyle
= \frac{2}{\pi}
\left [ \arctan {u} \right ] _ {0} ^ {e ^ x}
 \displaystyle
= \frac{2}{\pi}
\arctan {(e ^ x)}

 を得る。

[2] 問題文の言い換え

  さて, 題意より,

 \displaystyle
P \left( f(X) \leq a \right)  =
\frac{2}{\pi}
\arctan {(e ^ a)}
\tag{4}

 を満たす  f を求めればよい。

[3] 求める関数の単調増加性を仮定

  ここで,  f が単調増加であると仮定する。このとき  f逆関数をもち, かつその逆関数は単調増加である。よって,  f(X) \leq a \Longleftrightarrow X \leq f ^ {-1} (a) だから,

 \displaystyle
P \left( X \leq f ^ {-1} (a) \right)  =
\frac{2}{\pi}
\arctan {(e ^ a)}
\tag{5}

 を満たす  f を求める問題に帰着される。


[4] 求める関数を累積分布関数  F で表す

   (5) において, いま  X が一様分布に従うという仮定から,  P(X \leq x) = x となるので,

 \displaystyle
f ^ {-1} (a)  =
\frac{2}{\pi}
\arctan {(e ^ a)}
\tag{6}

 となる。


[5] 求める関数を得る

   (6) より, 求める  f を得る。 \displaystyle y = \frac{2}{\pi} \arctan{e ^ x} とおくと,

 \displaystyle
\frac{\pi}{2} y = \arctan(e ^ x)

 \displaystyle
e ^ x = \tan \left (  \frac{\pi}{2} y \right )

 \displaystyle
x = \log _ {e} \left ( \tan \left (  \frac{\pi}{2} y \right ) \right )
\Longleftrightarrow
y ^ {-1} =  \log _ {e} \left ( \tan \left (  \frac{\pi}{2} x \right ) \right )

 だから, 求める  f

 \displaystyle
f(x) = \log _ {e} \left ( \tan \left (  \frac{\pi}{2} x \right ) \right )

 となる。これは  f が単調増加という仮定を満たす。□


(問題出典・参考文献)

渡辺 澄夫, 村田 昇.『確率と統計 ― 情報学への架橋 ―』. コロナ社.