ベイズ統計学を学んでみた。（その2）

前回はイントロで、今回から具体的な内容に入っていく。

確率論

ベイズ統計学を考えていくのに必要となるのが、確率論。まずはこの確率論の基本的なところを押さえていきたい。

なお、高校数学の確率論だと、集合の要素数を使って確率を定義していく。また、大学で扱うような公理的確率論だと、コルモゴロフの公理から確率を定義していく。

ただ、前者は連続変数を扱う場合には力不足だし、後者は直感から外れるところ（確率変数の定義とか）があって分かりにくい。

そこで、自分は「分布」を基礎として確率を定義していきたい。このあとの議論をみれば分かるように、分布から確率を定義していくと、直感的で分かりやすく、それでいて連続変数を扱うことも可能になる。

確率変数

何かをやったときに起こりうる事象をすべて集めた集合を、確率変数と呼ぶことにする。確率変数は集合なので、一般に大文字（たとえば $X$ ）で表記する。

なお、慣例にしたがって“変数”と呼んでいるけれど、実際には“集合”なので、普通の変数（ $x$ とか）とは違い、何か値が代入されたりするわけではない。

また、公理的確率論だと確率変数は関数として定義されるけど、ここではそう定義していないので、公理的確率論の確率変数とは厳密には別物なので注意。関数として定義してるのに $X=2$ とか書いてる時点でおかしいんだけどね・・・公理的確率論では標本空間に相当する。

閑話休題。

確率変数の一例は、サイコロ1個を振ったときの出目。この確率変数を $X$ とすると、 $X = \{1, 2, 3, 4, 5, 6\}$ となる。

あるいは、コイン投げの結果も確率変数の1つで、この確率変数を $Y$ とすると、 $Y = \{\text{表}, \text{裏}\}$ となる。確率変数の要素は、別に数字じゃなくてもいい。

他にも、適当に誰か1人を選んだときのその人の身長とかも確率変数になる。人間の身長だと小さくても30cmくらいから大きくても250cmくらいだと思うけど、それよりも小さかったり大きかったりというのは考えられる。なので、取りうる値は0より大きい実数とし、この確率変数を $Z$ とすると、 $Z = \mathbb{R}_{> 0}$ となる。