前回はイントロで、今回から具体的な内容に入っていく。
確率論
ベイズ統計学を考えていくのに必要となるのが、確率論。 まずはこの確率論の基本的なところを押さえていきたい。
なお、高校数学の確率論だと、集合の要素数を使って確率を定義していく。 また、大学で扱うような公理的確率論だと、コルモゴロフの公理から確率を定義していく。
ただ、前者は連続変数を扱う場合には力不足だし、後者は直感から外れるところ(確率変数の定義とか)があって分かりにくい。
そこで、自分は「分布」を基礎として確率を定義していきたい。 このあとの議論をみれば分かるように、分布から確率を定義していくと、直感的で分かりやすく、それでいて連続変数を扱うことも可能になる。
確率変数
何かをやったときに起こりうる事象をすべて集めた集合を、確率変数と呼ぶことにする。 確率変数は集合なので、一般に大文字(たとえば)で表記する。
なお、慣例にしたがって“変数”と呼んでいるけれど、実際には“集合”なので、普通の変数(とか)とは違い、何か値が代入されたりするわけではない。
また、公理的確率論だと確率変数は関数として定義されるけど、ここではそう定義していないので、公理的確率論の確率変数とは厳密には別物なので注意。関数として定義してるのにとか書いてる時点でおかしいんだけどね・・・ 公理的確率論では標本空間に相当する。
閑話休題。
確率変数の一例は、サイコロ1個を振ったときの出目。 この確率変数をとすると、となる。
あるいは、コイン投げの結果も確率変数の1つで、この確率変数をとすると、となる。 確率変数の要素は、別に数字じゃなくてもいい。
他にも、適当に誰か1人を選んだときのその人の身長とかも確率変数になる。 人間の身長だと小さくても30cmくらいから大きくても250cmくらいだと思うけど、それよりも小さかったり大きかったりというのは考えられる。 なので、取りうる値は0より大きい実数とし、この確率変数をとすると、となる。
やのように要素が離散的な確率変数を離散確率変数と呼ぶ。 また、のように要素が連続的な確率変数を連続確率変数と呼ぶ。
今日はここまで!