いものやま。

雑多な知識の寄せ集め

ベイズ統計学を学んでみた。(その8)

前回は周辺確率分布を定義した。

今回は条件付き確率分布を定義する。

固定化と条件付き確率分布

確率変数 X, Y, Zの同時確率分布 P\langle X, Y, Z\rangle : X \times Y \times Z \rightarrow \mathbb{R}_{\ge 0}に対して、 Zをある値 zに固定したときの X Yの同時確率分布を条件付き確率分布と呼び、次のように定義する:


P\langle X, Y\rangle [Z](x, y | z) = \frac{ P\langle X, Y, Z\rangle (x, y, z) }{ P\langle Z\rangle (z) }

なお、 P\langle X, Y\rangle [Z] : X \times Y \times Z \rightarrow \mathbb{R}_{\ge 0}だが、ここでは P\langle Z\rangle (z) = 0となる zでは未定義としておく。 (この P\langle Z\rangle (z) = 0となる場合は非常に厄介で、詳細はまた別に議論したい)

命題

 P\langle 2^X, 2^Y\rangle [Z] (X, Y | z) = 1

証明


\begin{align}
P\langle 2^X, 2^Y\rangle [Z] (X, Y | z)
&= \underset{x \in X, y \in Y}{\int\!\int} \frac{ P\langle X, Y, Z\rangle (x, y, z) }{ P\langle Z\rangle (z) } \, dx \, dy \\
&= \frac{ 1 }{ P\langle Z\rangle (z) } \underset{x \in X, y \in Y}{\int\!\int} P\langle X, Y, Z\rangle (x, y, z) \, dx \, dy \\
&= \frac{ 1 }{ P\langle Z\rangle (z) } \cdot P\langle Z\rangle (z) \\
&= 1
\end{align}

よって示された。 \Box

この命題から、 P\langle X, Y \rangle [Z]はたしかに確率変数 X, Yに関する同時確率分布になっていることが分かる。 (=記法での不一致は起きていない、ということ)

周辺化と同じように、ここではこれを確率変数 Zを値 z固定化した呼ぶことにする。 (※これは独自の言葉で、一般に固定化という用語はない)

複数変数の固定化 vs 複数回の固定化

固定化に関しても周辺化と同じ議論ができ、次の命題が成り立つ:

命題

同時確率分布 P\langle X, Y, Z \rangleに対して、 Y, Zを固定化した確率分布 P_1\langle X \rangle [Y, Z] と、 Zを固定化した P\langle X, Y\rangle [Z] に対して Yを固定化した確率分布 P_2\langle X\rangle [Y, Z] は等しい。

証明は周辺化のときと同じように定義にしたがって計算するだけなので省略。

f:id:yamaimo0625:20210430165233p:plain


さて、分母が0になる場合について議論したいんだけど、長くなるので次回で。

今日はここまで!