講義でCantor集合とCantor関数を取り上げた。
情報関係ですぐれた研究成果を出している人でも、数学以外の出身だと、[W:一様連続]性の定義をはっきりいえる人は少ないようだ。一様連続が分からなくて困ったことは学部を卒業してから1回もないという。まして、[W:絶対連続]というと、聞いたこともないという人が多いのかもしれない。 しかし、[W:ルベーグ積分]の微分に相当するRadon-Nykodimの定理は、情報理論やデータマイニングを研究していく上で避けては通れないものである。
Radon-Nykodimの定理とは、$latex (\Omega,{\cal F})$上の測度$latex \mu,\nu$と$latex {A\in {\cal F}}$について、
[latex] \nu(A)=0 \Longrightarrow \mu(A)=0 [/latex]
であるとき、$latex \mu$は$latex \nu$について絶対連続であるといい、$latex \mu << \nu$とかく。このことと、任意の$latex A\in {\cal F}$について、
[latex] \mu(A)=\int_A f(\omega)d\nu[/latex]
となる$latex {\cal F}$上可測な$latex f$が存在することが同値であることをいっている。ただし、$latex \mu,\nu$は、$latex \sigma$有限といって、測度の値が有限の値をとる可算個の$latex {\cal F}$の要素の和で$latex \Omega$が表現できることを仮定する。
Cantor集合は、$latex [0,1)$の要素の小数点以下を$latex \{0,1,2\}$の3進数表示したときに、”1″が表れない要素の集合である。そのような点の占める長さ(ルベーグ測度)は0となることを前回の講義で示した。また、小数点以下を$latex \{0,2\}$の2進数表示したことになるので、小数点以下を$latex \{0,1\}$の2進数表示した集合($latex [0,1)$全体)と1対1の対応ができて、非可算集合となる。
Cantor関数とは、$latex [0,1)$の各要素の3進数表示された各桁について、”0″と”2″に1/2の確率を割り当てて得られた分布関数である。Cantor集合は、ルベーグ測度が0でも確率測度が1となる。絶対連続ではない例として、よく用いられる。そのように構成した分布関数は、一様連続であることも証明できる。スライド6-7ページにもあるが、絶対連続であれば、一様連続になる。