完全にロジカルな学問的体系である数学にも上の指摘は当てはまっているような気がする。
統計理論の中で最もインパクトがある定理は何といっても「中心極限定理」だろうと思う。その証明は、中級ステージの数理統計学では最大の聞かせどころである。中心極限定理があるお蔭で、世論調査の結果であろうと、サイコロの目であろうと、どんなデータであろうと、ランダムにとられたデータの平均値には―データ数で割る前の合計もそうだが―正規分布を当てはめて確率評価をすればよい。正規分布一つにしぼって議論すればよいというのだから、これを初めて知った人は衝撃をうける。
小生も世間並みに教科書を出しているが、そこでは中心極限定理の証明に2ページ半を費やしている。ところが名著と言われるテキストでは証明はずっと短い。小生が見た中で最短の証明はラオ『統計的推測とその応用』にある証明だ。わずか数行ですませている。
× × ×
$f(t)$を$X_i-\mu$の特性関数とする。1次及び2次のモーメントが存在するから、
\[
f(t) = 1-\frac{1}{2} \sigma^2 t^2 + o(t^2)
\]
である。$Y_n = \sum_{i=1}^n \frac{(X_i - \mu )}{\sqrt{n} \sigma}$の特性関数は、上の式から
\begin{equation}
{ f }_{ n }\left( t \right) ={ \left[ f\left( \frac { t }{ \sigma \sqrt { n } } \right) \right] }^{ n }={ \left[ 1-\frac { { t }^{ 2 } }{ 2n } +o \left( \frac { { t }^{ 2 } }{ n } \right) \right] }^{ n }
\end{equation}
右辺の対数をとると
\begin{equation}
\log { { \left[ 1-\frac { { t }^{ 2 } }{ 2n } +o \left( \frac { { t }^{ 2 } }{ n } \right) \right] }^{ n } } =n\log { \left[ 1-\frac { { t }^{ 2 } }{ 2n } +o \left( \frac { { t }^{ 2 } }{ n } \right) \right] } \rightarrow \quad -\frac { { t }^{ 2 } }{ 2 }
\end{equation}
すなわち
\begin{equation}
{ f }_{ n }\left( t \right) \rightarrow { e }^{ -\frac { { t }^{ 2 } }{ 2 } }
\end{equation}
となる。(以上、奥野忠一他訳:120頁)これは標準正規分布の特性関数と一致するので、標準化された合計$Y_n$は標準正規分布に従う。
但し、上の証明は個々の確率変数が独立同一分布である場合の証明だ。が、多くの統計分析では有効性を失わない。小生は同じ仮定でずっと長々しい議論をダラダラと続けている。
× × ×
言うべきことは大事な点だけで足りる。長々とした説明は、本当は不必要だ。誤解の元になる。それでも長々とした説明をしたがるのは、丁寧な説明をしたという形をとりたいからだ。実は、それだけが理由であることがほとんどだ。
今日の授業でその中心極限定理の話題に到達したが、証明は積率母関数をスキップしたという理由でまるごとスキップした。証明しないというのは最短ではあるが、「最短」と「無い」とは無論異なる。
語らないよりは語るほうが意図が伝わる。とはいえ『言葉にしなければ伝わらないよ』という助言は、多く語りなさい、丁寧に語りなさいとは随分違うのだ。多く語れば分かりにくい、言葉が過剰になれば言葉だけが飛び交い意図が見えにくい、嘘も混じるだろう。
多く語るのは、まったく語らないのとあまり違わないと思う。しかし、こんなことを言っても、いわゆる「職業言論人」は聞く耳をもたないだろう。語ることで収入を得ている。それが理由である。
0 件のコメント:
コメントを投稿