いものやま。

雑多な知識の寄せ集め

ベイズ統計学を学んでみた。(その2)

前回はイントロで、今回から具体的な内容に入っていく。

確率論

ベイズ統計学を考えていくのに必要となるのが、確率論。 まずはこの確率論の基本的なところを押さえていきたい。

なお、高校数学の確率論だと、集合の要素数を使って確率を定義していく。 また、大学で扱うような公理的確率論だと、コルモゴロフの公理から確率を定義していく。

ただ、前者は連続変数を扱う場合には力不足だし、後者は直感から外れるところ(確率変数の定義とか)があって分かりにくい。

そこで、自分は「分布」を基礎として確率を定義していきたい。 このあとの議論をみれば分かるように、分布から確率を定義していくと、直感的で分かりやすく、それでいて連続変数を扱うことも可能になる。

確率変数

何かをやったときに起こりうる事象をすべて集めた集合を、確率変数と呼ぶことにする。 確率変数は集合なので、一般に大文字(たとえば X)で表記する。

なお、慣例にしたがって“変数”と呼んでいるけれど、実際には“集合”なので、普通の変数( xとか)とは違い、何か値が代入されたりするわけではない。

また、公理的確率論だと確率変数は関数として定義されるけど、ここではそう定義していないので、公理的確率論の確率変数とは厳密には別物なので注意。関数として定義してるのに X=2とか書いてる時点でおかしいんだけどね・・・ 公理的確率論では標本空間に相当する。

閑話休題

確率変数の一例は、サイコロ1個を振ったときの出目。 この確率変数を Xとすると、 X = \{1, 2, 3, 4, 5, 6\}となる。

あるいは、コイン投げの結果も確率変数の1つで、この確率変数を Yとすると、 Y = \{\text{表}, \text{裏}\}となる。 確率変数の要素は、別に数字じゃなくてもいい。

他にも、適当に誰か1人を選んだときのその人の身長とかも確率変数になる。 人間の身長だと小さくても30cmくらいから大きくても250cmくらいだと思うけど、それよりも小さかったり大きかったりというのは考えられる。 なので、取りうる値は0より大きい実数とし、この確率変数を Zとすると、 Z = \mathbb{R}_{> 0}となる。

 X Yのように要素が離散的な確率変数を離散確率変数と呼ぶ。 また、 Zのように要素が連続的な確率変数を連続確率変数と呼ぶ。

今日はここまで!