条件付確率

投稿者: | 2010年5月28日

一般の確率空間[latex](\omega,{\cal F},P)[/latex]で、[W:条件付確率]を定義したらどうなるか。Wikipediaでも、英語版、日本語版ともに高校でやったような特殊ケースしか掲載されていない。拙書「ベイジアンネットワーク入門」では、以下のような定義をしている。Radon-Nikodymの定理から、[latex]A\in {\cal F}, {\cal G}\subseteq {\cal F}[/latex]として、任意の[latex]G\in {\cal G}[/latex]について、[latex] P(A\cap G)=\int_G f_A(\omega)dP(\omega)[/latex]となる[latex]{\cal G}[/latex]上可測な[latex]f_A:\Omega\rightarrow [0,\infty)[/latex]が存在する。これを、[latex]{\cal G}[/latex]のもとでの、[latex]A[/latex]の条件付確率という。ここで、 [latex]f_A,g_A[/latex]がともにその条件を満足すれば、[latex]f_A-g_A[/latex]は[latex]{\cal G}[/latex]上可測であり、[latex]G=\{\omega\in \Omega|f_A(\omega)\not=g_A(\omega)\}\in {\cal G}[/latex]の確率[latex]P(G)[/latex]は0である。

[latex]{\cal G}=\{B,\bar{B},\Omega,\{\}\}[/latex]であれば、高校で勉強したような条件付確率[latex]P(A|B),P(A|\bar{B})[/latex]が定義できる。条件付確率とは、[latex]B,\bar{B}[/latex]などの事象のもとで決まるものではない。[latex]\cal F[/latex]の部分[latex]\sigma[/latex]集合体(事象の集合)[latex]\cal G[/latex]に対して定まる写像である。

データマイニングでも、情報理論でも、条件付確率を一般的に正しく理解すれば、見通しのよい議論ができる。高校卒業時から進歩せず、条件付確率として、[latex]P(A|B),P(A|\bar{B})[/latex]のようなものだけを扱っていると、新しいアイデアが出てこないだけではなく、確率の少し難しい論文はお手上げになる。

本日の講義では、第2章グラフィカルモデルの最後2.4, 2.5以外に、2.1の条件付分布関数の説明を行った。[latex]Z[/latex]のもとでの[latex]X[/latex]の条件付分布関数といった場合、一般に一意ではないが、[latex]Z[/latex]の生成する事象について確率1で一致すれば、等価な関数とみなす。条件付独立性についても同様である。


ベイジアンネットワーク 第6回: 第2章グラフィカルモデル 2.4 有向グラフ(2010年5月27日)


ベイジアンネットワーク 第6回: 第2章グラフィカルモデル 2.5 Bayesianネットワーク: 依存モデルの有向非巡回グラフによる表現(2010年5月27日)