2023年10月6日金曜日

メモ: 意味のない情報を強調しても無意味であるデータ例

本日の投稿は報道と統計学とが混じりあう一つの部分かもしれない。

 

毎日の報道を視聴していると、

この動きを新たに強調しても意味はないのではないか?

この情報には何のメッセージも含まれていないのではないか?

報道従事者が仕事をしているというアリバイ作りではないか?

こんな風に思わざるを得ない時が多々ある。


統計畑でメシを食っている人なら周知のデータ例が下図である。





上段の"series"は、何かの銘柄の株価推移だと思っても可であるが、左目盛りをみれば分かるように、これは実データではなく、シミュ―レーションで発生させた人工データである。

この動きをみると、一見して循環性があるように見える。直近の数時点においては下降線をたどり、その後に僅かな回復を見せていることに、そして足元ではその回復に陰りの兆しが表れていることに、深い意味があるように見える。

しかし、こういう印象はまったくの錯覚なのである。

データの前期差をとってみたのが下段の"change"である。実は、この"change"は標準正規分布から1000個発生させた乱数列を時系列にしたものである。

同じ確率分布から発生しているという点で"change"は定常時系列であるが、それ以外に毎時点のデータには何の意味もなく、最近何時点かで下がったからと言って将来予測に有益な情報は一切含まれない ― 「含まれない」というより毎時点、毎時点「今後もこのままで行くだろう」と予測できるだけである。実際はずっと変化し続けているにも関わらず、どう変化するかが分からない。

つまり上段の"series"は1000個の正規乱数の累積和として定義される《ランダムウォーク》であって、100パーセント不規則に変動している、データ丸ごとが《ノイズ》、シグナル対ノイズ比がゼロである、というわけだ。

故に、上段の"series"について
このところ低下しています。

どうやら底打ちしたようです。 

新たに発表されたデータは〇〇時点振りに低下に転じました
という風な報道には、一切意味がない。「だから何?」というわけだ。前期と比べて上がるのも偶然、下がるのも偶然。偶然を「もっともらしく」説明するのは間違った理解につながる。伝えようとする善意によって間違った理解を形成し、それが政策の誤りにつながるとすれば、最初の報道の罪というものだろう。


つまり本日の投稿で言いたいことは

ノイズをフォローして逐一報道するメディア活動はそれ自体がノイズである。

大事なことは、まったくの偶然による変化と何かの要因が働いている変化とを区別できる見識である、という点だ。願わくば、その要因が何かを洞察できる知的学力があってほしい、ということだ。


マスメディアという活動には有益な情報が提供されていて初めて社会的意義がある。というか、それがメディアという産業のミッションである。

伝えるべき情報を伝えているか、恣意的に選択していないか?
伝えても意味のない情報を伝えて社会の安定性を損なっていないか?

 

これらの検証は常日頃からしなければなるまい。製造業で広く採用されている《品質管理》は提供している製品の品質を検証する自己努力に他ならない。学界であれば、査読誌におけるレフェリー制が該当するし、学校であれば毎年度定期的に実施している自己評価や学生による授業評価がそれにあたると言えるだろう。

最近のマスコミの振る舞いをみていると、自らが情報産業に従事しているという感覚が欠如しているように観える。




0 件のコメント: