前回は確率変数が複数ある場合の確率分布や確率を定義した。
そこから派生する議論を今回からはしていく。
周辺化と周辺確率分布
確率変数の同時確率分布に対して、 関数を次のように定義する:
つまり、に関して積分して元の関数(同時確率分布)からを取り除いた関数。
命題
証明
よって示された。
この命題から、関数は確率変数に関する同時確率分布になっていることが分かる。 (=記法での不一致は起きていない、ということ)
このように、同時確率分布から同時確率分布を得ることを、を周辺化するといい、に対してを周辺確率分布と呼ぶ。
一つ注意したいのは、この周辺確率分布というのは相対的なものだということ。
たとえば、このに対して同様にを周辺化した確率分布を考えることができるけど、から見たときは周辺確率分布になっているのに対し、から見たときは周辺確率分布にはなっていない。
複数変数の周辺化 vs 複数回の周辺化
さて、同様にして、同時確率分布からとを周辺化した周辺確率分布も定義できる:
また、同時確率分布からを周辺化した周辺確率分布は同時確率分布でもあるので、さらにを周辺化して周辺確率分布を得ることもできる。
となると、問題となるのは、この2つの確率分布が一致するのかどうか。
幸いにも、次の命題でこの2つは一致することが示される:
命題
同時確率分布に対して、を周辺化した確率分布と、を周辺化したに対してを周辺化した確率分布は等しい。
証明
まず、
そして、
したがって、。
図示すると次のようになっている:
この命題が成り立つので、記法は周辺化のやり方に依存しなくていいとなる。 (本当は命題が成り立つ前はちゃんと記法を分けて議論した方がいいんだけど)
ところで、確率変数を2つでしか考えていないと、この問題は出てこない。 なので、上の命題をそもそも考えたことがない人が多いはず。 確率変数を3つにして考えることで、こういったことも気づける。
今日はここまで!