前回は確率分布を定義した。
今回は確率を定義する。
確率
まず、集合の部分集合をすべて集めた集合を冪集合といい、で表すことにする:
そして、確率変数の部分集合に対して、関数を次のように定義する:
この関数を確率と呼ぶ。
確率分布は引数が「確率変数の要素」であるのに対し、確率は引数が「確率変数の部分集合」だというのが重要。 そして、部分集合が引数にくるというのを分かりやすくするために、山括弧には冪集合を書くようにしている。
この定義から、次の命題がただちに言える:
命題
証明
分布の規格化定数をとすると、
よって示された。
従来の記法との対応
ここで、従来の記法との対応を書いておく。
まず、もしくは、と書かれていた場合、これはに相当し、変数に対する確率分布を意味する。 (ただし、要素が1つだけの部分集合に対する確率を意味していたり、累積分布関数を意味してる可能性もありそうなので、文脈をよく確認した方がいい)
そして、もしくはのように書かれていた場合、これはに相当し、部分集合に対する確率の値を意味する。
最後に、もしくはのように書かれていた場合、もしくはに相当する(どちらであるかは文脈依存)。 これは、前者であれば確率分布の値を意味し、後者であれば確率の値を意味することになる。
こんな感じで、従来の記法だと似た記法で確率分布と確率、さらには関数とその値を全部ごっちゃにして表現してたので、文脈をちゃんと把握する必要があったし、意味も分かりにくくなっていた。 これを自分の記法にすると、それぞれがちゃんと明確に区別され、関数の定義域もハッキリするのが分かると思う。 書くのはちょっと大変だけど。
ちなみに、という組を考えると、これはコルモゴロフによる確率空間の公理を満たしている。 なので、今回定義した確率は確率空間の1つであると言える。 もちろん、コルモゴロフの公理を満たす確率空間は他にも考えられるので、今回の定義は万能のものではないんだけど、実用上はこれで十分じゃないかな。
今日はここまで!