2014年5月24日土曜日

東京から戻って-ビッグデータはデジタル・リサイクル産業である

応用統計学会の年会があって水・木・金と東京に行ってきた。統計関連学会では、このところ必ずビッグデータの話しが出る。今回も二日目にビッグデータのチュートリアル・セミナーがあった。おりしもJR東日本によるSUICAカード情報取引が個人情報漏えいに該当するという騒動があったばかりだ。テーマはビッグデータの暗号化、匿名化であった。

☆ ☆ ☆

ビジネスプロセスの中でデータが集まってしまう、その自然に集まったデータは不特定情報の集積であり、そのままではどう分析していいかわからないのだが、それでも顧客の行動を写し出す情報の塊であり、放置してよいはずがない。

業務データは、個人情報の塊なのだが、保存してから一定期間経過後に削除せよという規則があるわけでもない。そのビッグデータをデータベースとして整えて、統計分析に乗るように再編すれば、自社利益の拡大戦略を検討する材料にもなるし、その情報がほしいとコンタクトをとってくる他社も現れるわけである。本来は、自然に溜まった生活ごみのようなデジタル・ウェイスト(digital waste)であったのが、いつしかビッグデータ(Big Data)に成り上がったのだから、何がカネになるのか分からないものである。

☆ ☆ ☆

とはいえ、ビッグデータという言葉にはアメリカンな薫りが詰まっているのも事実だ。自動車は売れなくなった、金融工学はクラッシュして信頼が取り戻せない、じゃあ情報を切り売りするか。「メガ企業の社内には膨大なデータが廃棄されないまま保管されている。マーケティングのためにそのデータを欲しがる会社も相当いるのじゃないか、それに自社の効率化にその情報を利用できないか」。アメリカがそんな風に考えても可笑しくはないわなあ…、そう思いつつ見ている。

小生が某官庁で小役人をしていた頃、情報管理室には大型汎用電子計算機(=メインフレーム)が広さ100平米ほどの空間を占拠していて、入室権をもっている有資格者(=オペレーターと尊称されていた)しか室内には入れなかった。その頃、経済分析の王道はマクロ計量経済モデルによるシミュレーションで、想定をいくつか設けた複数のケースごとに数値実験を繰り返す作業が毎日行われていたものだ。半日も仕事をすると、ラインプリンタが印刷して打ち出すアウトプットはA3サイズで300枚とか400枚になるのが当たり前だった。その何百枚もあるほとんどは、途中の計算に不審な箇所があるかどうかのチェック目的であって、まずは見ないのだな。見るのは最後の数ページにある計算結果だ。そして、一日の成果は上役の課長補佐がいう『これは上げられないね、もうちょっと頑張ってやり直して』、その一言で出力されたばかりのアウトプットは部屋の隅に移動され、そこには紙の山がアルプスの造山運動よろしく形成されていったものだ。私達は、紙の山を"Waste of Paper"と呼んでいたが、その紙ゴミはいかに重量が嵩んだとしても、取引価値は1キロでせいぜい何十円という金額ではなかったろうか。

現代という時代は、目に見えぬ電子ゴミ"Digital Waste"に何千万円、何億円というカネが払われる。その電子ゴミを情報資源として活用するためのソフトウェアにも巨額のカネを払う。増産はせずとも<ビッグデータ>に投資する。"Big Data"は電子ゴミではない。デジタル資産(Digital Asset)、電子の金鉱(Electronic Goldmine)になった。時代は変わったものである。まあ、電子ゴミしか売るものがなくなった、ホントにそうなら、それもまた情けない話しではあるのだが……。

0 件のコメント: