前回は分布を定義した。
その中で、分布の値は比例尺度であり、本質的に同じ分布が複数あることに言及した。
今回はその対処を考えることで確率分布を定義する。
相似な分布
「分布が本質的に同じである」ということをもう少しちゃんと定義するために、相似な分布というものを定義する。
確率変数に対して2つの分布を考える。 この2つの分布に対して、ある正の実数が存在し、任意のについてが成り立つとき、とは相似であるといい、と表記することにする。
記号で表現すると、以下の通り:
なお、これは独自の定義なので、他の統計の本ではたぶん出てこない。 の記号はよく使われてるけど。 (これは実際に上記の相似の定義と同じになっている)
前回のサイコロの例だと、とは相似になっている (とすればいい)。
一方で、
とすると、はやとは相似になっていない。 条件を満たすようなが存在しないことは簡単に分かる。
さて、上のように相似を定義すると、次のことがすぐに言える:
命題
分布の相似は同値関係である。
証明は簡単なので省略。
また、相似な分布は本質的に同じ分布であることが次の命題から分かる:
命題
確率変数の2つの分布について、とする。このとき、についてが成り立つ。
証明
なので、あるが存在し、任意のに対してとなる。よって、
規格化と確率分布
定義から分かるとおり、相似な分布はいくらでも作れる(適当に定数倍すればいい)ので、その相似な分布の集まりを代表するような分布を1つ考えたい。 そのときパッと思いつくのは、分布の値を全部足し合わせた値を1として基準にする方法。
今、確率変数の分布に対してであると仮定する。 このとき、確率分布を次のように定義する:
上記のように分布から確率分布を得ることを規格化といい、分布に掛けた定数のことを規格化定数と呼ぶ。
のときであるので、確率分布は規格化定数が1であるような分布であるとも言える。
さて、確率分布が相似な分布の集まりの代表として使えることは、次の命題から言える:
命題
確率変数の2つの分布を規格化した確率分布がそれぞれであるとする。
このとき、である。
証明
とする。
ならば、あるが存在してなので、
よって、
逆に、ならばであり なので、とすればである。
規格化の例
サイコロの例
規格化の例として、先程のサイコロの例を考えてみる。
サイコロの出目の分布に対する確率分布は、規格化定数が
なので、
となる。
また、分布については、規格化定数が
でありなので、分布は確率分布でもあることが分かる。
長さの例
別の例として、前回の、長さ1cmのものを測ったときの例も考えてみる。
この例では観測値を確率変数であるとし、その分布は
であると考えた。
これを規格化した確率分布は、
であるので規格化定数は10であり、
となる。
今日はここまで!