2015年3月14日土曜日

意外に使えるRコマンダー

来年度の授業ではRを基本ツールにする予定だが、実は統計授業の基本ツールをエクセル「分析ツール」からRに変更すること自体は、今年度前期に実行済みなのだ。

ただ完全な空振り、というか失敗に終わった。授業評価がガクッと下がってしまったのだな。

授業内容は推測統計学を柱とする旧態依然の内容。標準誤差も有意性もガンガンでてくる。それにコマンド操作によるRが入ってきたのだから、学生から見れば『統計…この、遠すぎた橋』になったのは無理もない。

☓ ☓ ☓

その反省もあって、来年度は内容を完全リニューアルして、Rを対話式で使うことにした。知人からは自治医科大学で配布している"EZR"(Easy R)を薦められもしたが、どうもやっぱり医学教育向けの統計技術が主になっている。患者に直面する医学の現場と、顧客に直面するビジネスの現場とは、互いに似ているところがないでもないのだが、一方が治療効果を追求するのに対して、他方は顧客心理という漠然としたものを把握したい。そんな違いがある以上、データ分析技術も違ってくるのは当然だと思うのだ。

Rコマンダーは意外に使える。以前はデータファイルを配置するフォルダーに2バイト文字を使うと文句を言っていたが、その辺も含めて大分完成度が上がってきた印象だ。

ただ、主成分分析は七つ道具に入れようと思うのだが、因子分析は無理だ。因子分析をやるなら共分散構造分析(→確証的因子分析)までやってしまわないと意味がない。

ここは方向を変えて、主成分分析からデータ視覚化へ、データ視覚化からクラスタリングへと進んで、顧客のセグメンテーション、各セグメントの特徴付け、さらにマーケティングの方向付けについて考える。こんな進み方も自然であるし、ビジネスで使うならここまでは確かな道だと思われる。

☓ ☓ ☓

となると、量的データでは主成分分析から入るのだから、質的データを数量化し、その主成分をおさえる対応(コレスポンデンス)分析が次の話題となるのは非常に論理的だ。ここでもクラスタリングへと進む。データが数量であるか、因子であるかで手法が分かれるが、やることは同じだ。これは極めて自然である。

しかし、Rコマンダーのメニューにはまだ対応分析がない。二つの次元の相互関連を分析するという対応分析の本来の目的に忠実だからだろう。ま、最新のFactoMineRを対話式で使うパッケージがあるのでインストールしてはいる。が、まだ研究中で授業に使えるかどうか分からないのだ — 統計とはいっても、この分野、本業領域でもないし。

とはいうものの、行属性を回答者、列属性を回答とすれば、回答状況を踏まえて数値化した得点を回答者に付値できるのだから、対応分析を主成分分析の質的変量版と認識するのが自然な流れじゃないかなと感じる次第。

なので対応分析ではコマンドを使って計算させることになるのが、とてもアンバランスで不満なのだ。素材にする予定にしているデータが、「朝ドラ『マッサン』の放映と地元観光客の意識」をアンケート調査したものなので、なおさらのことである。

0 件のコメント: