2012年4月4日水曜日

数学ブームと統計ブーム

今日もまた前回に続く尻取りゲームのような投稿だ。小生が勤務する職場が提供しているブログに寄稿を求められた。その半分以上は既に投稿した内容と重複するのだが、最終パラグラフは新規に書いたことでもあり、視点は少し異なっている。覚え書きとして保存しておくことにした。

ですます調になるなど語調が変わっているのは、職場のブログに合わせたためだ。

× × ×

世は「数学ブーム」であるとは耳にしています。実際、書店の数学書コーナーに行くと、啓蒙書や入門書が非常に増えているのに驚かされます。


「統計ブーム」である、とも言われています。金融工学の成功と破綻が興味を刺激したのでしょうか?それもあるでしょうが、どうやらリスクなるものに社会の関心が向き始め、不確実な状況でもとにかく決断しないといけない。どれほど安全重視であっても、先が見えないいま、リスクから身を避けることはできない。そもそもリスクとは何だろう?そんな思いが浸透しているのかもしれません。であれば、手元のデータをどのように活用すれば成果を期待することができ、しかもリスクを小さくできるのか。そんな問題意識が浸透するのは自然なことです。


「そんなことなのかなあ・・・」と、色々、思いめぐらしていたところに、二つの知らせが届き「やっぱり、そうみたいだなあ」と納得することがありました。今日はその二つを紹介したいと思います。




× × ×


一つは新聞報道です。2月25日の日本経済新聞朝刊を読んでいた私は、平均値を理解しない大学生の学力低下、という記事に目が向きました ― 各紙も報じていたことと思われます。OBSブログに目を通す皆さんは読んだ方も多いでしょう。

 その記事は、日本数学会が主催した数学力テストの結果についてでした。対象者は、全国の国公立・私立大学生6千人です。サンプル調査ですが、全国大学生の正答率を推測するには、十分なサンプル数です ― マスメディアがよく行っているいわゆる<世論調査>は概ね千人規模の電話調査ですが、このくらいはコストをかけてデータを収集しないと精度に疑問符がついてしまいます。「ウンウン、さすが日本数学会だなあ」と、そう思いながら読んでいきました。

記事のヘッドラインと関係があるのは以下の問題についてでした。新聞には○、×の正答が示されていましたから、ここでは日本数学会の問題から引用させてもらいましょう。皆さんも一緒に回答してみてください。

1-1 ある中学校の三年生の生徒100 人の身長を測り、その平均を計算すると163.5
cm になりました。この結果から確実に正しいと言えることには○を、そうで
ないものには×を、左側の空欄に記入してください。

  1. 身長が163.5 cm よりも高い生徒と低い生徒は、それぞれ50 人ずついる。
  2. 100 人の生徒全員の身長をたすと、163.5 cm × 100 = 16350 cm になる。
  3. 身長を10 cm ごとに「130 cm 以上で140 cm 未満の生徒」「140 cm 以
    上で150 cm 未満の生徒」・・・というように区分けすると、「160 cm 以上で
    170 cm 未満の生徒」が最も多い。
上の三つの設問全部に正答した場合のみ正解となります。出題された問題は他にもありますから、上の問題には大体2~3分で答える必要があります。新聞報道は、大学生の正答率が76%でしかない。この点に焦点をあてていました。

新聞を読みながら、家内が近くでTVのワイドショーを観ていましたから質問してみました。家内は、女性には珍しく数学が好きで、歴史と国語が苦手であり、最近の趣味は「ナンプレ」、つまり数独にはまっています。

設問1は、平均値以下の人が半数いる、以上の人が半数いる。こうは断言できないわけですから、これは家内も正答しました。設問2は、出来なかった大学生がいたこと自体が不思議な現象です。設問3は、家内も間違えました。身長の分布は概ね左右対称であるし、平均身長が163.5センチであれば、その付近の人が一番多いだろう。そう考えたのですね。解答の鍵は「生徒100人の・・・」というところです。たとえ全体としては平均を中心に左右対称になっていたとしても、100人の分布だと違うでしょう。色々な100人がいますから。100人の身長の分布には凸凹があります。低い人と高い人がそれぞれ多く、並の人が少ない100人かもしれません。だから設問3もやはり×なのですね。


上のクイズは、「平均値」についての理解度がよくチェックできる良質のクイズだと思います。しかし、これだけで「平均値も理解できない大学生の低学力」とは言えないような気がしました。


そもそもデータにはランダムな揺らぎが含まれています。それゆえ、大事なことは、データの結果を丸ごと信じるのではなく、得られた結果は想定内であるかどうかという判断です。データを活用する前に特定の想定なり予想を持っていないと<判断>はできませんね。このような場合、二種類の間違いをおかす可能性があることは、統計学の授業でも大きな聞かせどころになっています。

一つは<第1種の判断ミス>と呼ばれています。これは<ヌレギヌ型>というか、想定は正しいのだが、データが想定外に思われる時のことです。もう一つは<第2種の判断ミス>。これは<見のがし型>というか、実際には想定が間違っているのに、データは誤差の範囲というか、「まあ正常」のように見える場合です。


本当にこわいのは、無論、後者の場合です。「おかしい!」と思ったところ、何も異常はなかったとしたら、ムダに騒いだ点はとがめられるでしょうが、何もなかったこと自体は良いことに違いないわけです。反対に、「測定結果は想定内であります」といえば、その場は丸くおさまるでしょうが、実際には想定に誤りがある。大惨事の可能性が見逃されてしまう。これでは手間ひまをかけて調べている意味がないことになります。


本当に怖いのは<第2種の誤り>の方です。想定内と判断する正にその時にこそ、失敗の芽が隠れているのですから。


話が横道にそれました。さて大学生の学力についてです。全体としては大学生の学力は低下していないと想定しましょう。今回の日本数学会が行ったテスト結果は、確かに不安を抱かせるものであり、この低い正答率は<想定外>の結果なのかもしれません。しかし、20年も昔の大学生に同じ数学テストをしたわけではなかろうと思います ― 日本数学会の提言でもこの点には触れられていません。「学力が十分だったはずの」昔の大学生なら、まずこんな回答はしない。事実、もっとできた。この点が確かめられているのであれば、今回の結果は現在の学生の学力低下を証拠付けるものになります。そうではなく、昔の大学生だって間違える問題なのであれば、今の大学生だって間違えて当然です。「ここを日本数学会ははっきりとさせてほしいのだがなあ・・・」と、記事を読み終えた私はそう思ったのです。


つまり厳しすぎる目で、もっと言えば<先入観>をもって、今回の数学テストの結果を新聞は論評しているかもしれません。データの結果をどう解釈して、どんな行動に結び付けていくか。統計の勉強で一番難しいところでもありますし、これこそ醍醐味というところでもあります。統計ブームがもっと深まって、単に学力低下と解釈する見方でいいのか、と。そんな議論も展開されてほしいものです。



× × ×


最初に「二つ紹介しましょう」と言ったもう一つを忘れていました。長くなり過ぎましたから、簡単な紹介にしておきましょう。それは私が所属している日本統計学会から郵送で送られてきたものです。封を開けると、統計検定のポスターと2011年11月20日に実施した検定試験(2級、3級、4級)の問題が入っていました。統計検定の創設については、当然、聞いていましたが、詳細な実施内容まではフォローしていませんでした。統計検定のオフィシャルサイトも既に稼働しています。2012年度にはイギリス王立統計協会(Royal Statistical Society)との共同実施により国際資格の検定も始めるようです。確かに統計調査士や専門統計調査士という職業資格も、統計ブームを単なる流行語に終わらせないために、必要なものかもしれません。いわゆるNumerical Literacyというか、数的処理能力が、現在の社会で非常に必要になっている。そんな実態に支えられた統計ブームであるのなら、統計検定も発足が遅すぎたくらいである。そう言えるのかもしれません。

0 件のコメント: