1年生の統計学の期末テスト: 解き方を覚えるだけの間違った勉強法から脱却すべし

投稿者: | 2018年7月28日

4月から始まった統計学の1年生の講義、7月27日に期末テストを行った。できる人とできない人とで、大きな差が出た(1/4が80点以上で、1/4が40点以下、平均60点)。残念なことだが、理解をしようとしないで、「解き方を覚えればよい」という考えの学生がかなりいるように思えた。公式を覚えて数字を入れるという作業をしていても、勉強をしていることにならないし、そのやり方をいつかは変えないと、ゼミや卒論を乗り越えることはできない。仮に卒業できたとしても、そういう単純作業しかできない学生は将来、知的な仕事につくことも難しいだろう。まだ1年の前期だし、卒業するまでに変化がおこるものと、信じたい。

以下が今回の問題で、特に問題2,3(頭を使う問題)があまりできていなかった。逆に、問題5,6,7のように演習問題に近い問題はよくできていた。

  1. 標本空間$\Omega$、およびその事象族$\cal F$があたえられたとき、$\cal F$を定義域とする写像$P$が確率であることの定義をいえ。ただし、その定義は、3個の条件で、最低限のものからなっているものとする(3条件すべて正しいときのみ10点)。
  2. 以下の確率変数$X,Y$について、独立ではないが、共分散が0になっているものをすべてえらべ(答えだけで良い、10点)。
    (a) $X$が等確率で$-1,1$の値をとり、$Y:=-X$
    (b) $U,V$が標準正規分布にしたがうとき、$X:=(U+V)/2$, $Y:=(U-V)/2$
    (c) $X$が標準正規分布にしたがうとき、$Y:=-X$
    (d) $(X,Y)=(1,0), (0,1),(-1,0),(0,-1)$が等確率で生じる。
  3. 身体測定をして、体重の小数点以下切り捨て測定した値だけが得られ、そうしたデータによって生成される事象族を考える。以下でそのような事象となるものはどれか(答えだけで良い、10点)。
    (a) 60キロ以上61キロ未満、または62キロ以上64キロ未満
    (b) 64キロより大きく、65キロ以下
    (c) 0キロ以上
    (d) 60キロ以上62.5キロ未満
  4. $\Sigma_n=A_nA_n^T$とかける正則な行列$\Sigma_n, A_n\in {\mathbb R}^{n\times n}$、ベクトル$[\mu_1,\cdots,\mu_n]^T \in {\mathbb R}^n$と独立な標準正規分布にしたがう確率変数$U_1,\cdots,U_n$をもちいて、確率変数$X_1,\cdots,X_n$を、以下で定義する(15点)。
    $$
    \left[\begin{array}{c}
    X_1\\
    \vdots\\
    X_n
    \end{array}\right]
    =A_n
    \left[\begin{array}{c}
    U_1\\
    \vdots\\
    U_n
    \end{array}\right]
    +
    \left[\begin{array}{c}
    \mu_1\\
    \vdots\\
    \mu_n
    \end{array}\right]$$
    (a) 一般の$n$について、共分散行列が$\Sigma_n$となることを証明せよ。
    (b) 一般の$n$について、$X=(X_1,\cdots,X_n)$の同時確率密度関数$f_{X_1\cdots X_n}(x_1,\cdots,x_n)$はどのような式になるか(答えのみでよい)。
  5. 以下の各問に答えよ(20点)
    (a) 確率変数$X$の平均が$\mu$、分散が$\sigma^2$のとき、任意の$\epsilon>0$に対して、$\displaystyle P(|X-\mu|\geq \epsilon)\leq\frac{\sigma^2}{\epsilon^2}$(チェビシェフの不等式)を証明せよ。ただし、「$Z$を非負の値をとる確率変数とするとき、$a>0$として、$E[Z]\geq aP(Z\geq a)$」(マルコフの不等式)は証明なしで用いて良い。
    (b) 平均$\mu$が同じで、分散$\sigma_1^2,\cdots,\sigma^2_n$が異なる確率変数$X_1,\cdots,X_n$について、
    $\displaystyle \lim_{n\rightarrow \infty}\frac{1}{n^2}\sum_{j=1}^n \sigma^2_j=0$ が成立するとき、確率変数の列$\bar{X}_1,\bar{X}_2,\cdots$が$\mu$に確率収束する(大数の弱法則)ことを証明せよ。
  6. 独立に発生した平均$\mu$、分散$\sigma^2$の正規分布にしたがう$X_1,\cdots,X_n$から、$\displaystyle \bar{X}_n:=\frac{1}{n}\sum_{i=1}^nX_i$および$\displaystyle S_n^2:=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X}_n)^2$について(20点)、
    (a) $2S_2^2/\sigma^2$が自由度1の$\chi^2$分布にしたがうことを証明せよ。
    (b) $(n+1)S^2_{n+1}/\sigma^2-nS^2_n/\sigma^2$が自由度1の$\chi^2$分布にしたがうことを証明せよ。ただし、等式$\displaystyle (n+1)S^2_{n+1}-nS^2_n=\frac{n}{n+1}(X_{n+1}-\bar{X}_n)^2$が成立することは証明無しで用いて良い。
    (c) $X_i-\bar{X}_n$, $i=1,\cdots,n$, と$X_{n+1}-\bar{X}_n$の共分散を求めよ。
    (d) $nS_n^2/\sigma^2$が自由度$n-1$の$\chi^2$分布にしたがうことを証明せよ。
  7. 分散$\sigma^2$の正規分布にしたがうグループ1の確率変数$X_{1,1},\cdots,X_{1,n_1}$の値、グループ2の確率変数$X_{2,1},\cdots,X_{2,n_2}$の値を観測し、両者の平均$\mu_1,\mu_2$の差$\mu_1-\mu_2$が0になることの検定を行いたい。$$\bar{X}_1:=\frac{1}{n_1}\sum_{i=1}^{n_1} X_{1,i}\ ,\ \bar{X}_2:=\frac{1}{n_2}\sum_{j=1}^{n_2} X_{2,j}\ ,\ S_1^2:=\frac{1}{n_1}\sum_{i=1}^{n_1}(X_{1,i}-\bar{X}_1)^2\ ,\ S_2^2:=\frac{1}{n_2}\sum_{j=1}^n(X_{2,j}-\bar{X}_2)^2$$について、$\mu_1=\mu_2$の仮説のもとで、以下の各確率変数は、どのような分布にしたがうか(それぞれ、答えのみでよい。15点)。
    (a) $\displaystyle \frac{\bar{X}_1-\bar{X}_2}{\sqrt{\sigma^2/n_1+\sigma^2/n_2}}$
    (b)  $\displaystyle (n_1S_1^2+n_2S_2^2)/\sigma^2$
    (c) $\sqrt{\frac{\displaystyle (n_1+n_2-2)n_1n_2}{\displaystyle (n_1+n_2)(n_1S_1^2+n_2S_2^2)}}(\bar{X}_1-\bar{X}_2)$