前回までで確率変数が1つの場合の確率を定義した。
今回からはそれを複数の確率変数がある場合に拡張していく。
確率変数の数
実際に議論していく前に、確率変数の数について少し言及しておきたい。
複数の確率変数に話を拡げる場合、よくあるのは2つの確率変数について議論していくというもの。 1つのものを2つにするのだから、これはとても自然に思える。
けど、単数ではなく複数を考えていくときに、実は2つと3つ以上の間には大きな壁が存在することが多い。
たとえば、計算量理論で有名なSAT(充足可能性問題)だと、2-SATは効率よく解けるけど、3-SATは(の前提で)効率よく解けないことが知られている。
参考:2と3の違い(岡本先生)
これは、2つだと組み合わせはないけど、3つ以上だと組み合わせが発生してくるのが一因だと思っている。
確率についても同様で、確率変数が3つ以上あると、2つのときとは本質的に違った難しさがある(と自分は思っている)。 けど、確率変数が2つで議論を進めてしまうと、その難しさに気づけない。
そこで、以下では基本的に3つの確率変数について議論していくことにする。
同時分布
まずは分布の拡張から。
確率変数に対して、がどれくらい起こりやすいかを関数で表すことにし、この関数を同時分布と呼ぶことにする。
同時確率分布
次は確率分布の拡張。
1つの確率変数のときと同様に、同時分布を規格化した同時分布を同時確率分布と呼ぶ。
すなわち、であると仮定して、
同時確率
そして、確率の拡張。
確率変数の部分集合に対して、関数を次のように定義する:
この関数を同時確率と呼ぶ。
同時確率についても次の命題が成り立つ:
命題
証明は1変数のときと同様なので省略。
補足
ちょっと追加で、確率分布と確率の中間の関数も定義しておく。
まず、1変数だけ積分した関数を次のように定義する:
また、2変数を積分した関数を次のように定義する:
どの変数を積分するかはいくつか組み合わせがあるけれど、いずれも上記と同様に定義されるとする。 そして、どの変数が積分されているのかや、関数の定義域は、山括弧から分かるものとする。
これらは何か意味があるような関数ではないのだけど、計算の途中で出てくることがあるので、ここで定義しておいた。
ここまでだと、わざわざ確率変数を3つ用意して議論している意味が見えないけど、次からはその意味が見えてくる。
今日はここまで!