y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

数式を使わないデータマイニング入門/岡嶋祐史

読書メモ
各種分析手法と目的
[ 分類 ]
クラスタ分析:散布図。k-means法(最初にいくつのクラスタに分けるかを決め、仮中心点を決める。距離を最小化するように再計算を繰り返す)
・定性的な情報:決定木分析
・自己組織化マップ:多次元データ(複数の属性項目軸がある)、わけの分からない集団

[ 関連発見 ]
・連関規則:”AならばB”の相関の強さを評価。ビールとオムツ。格言
[ 予測 ]
・落としどころを探る:回帰分析(最小二乗法プロット)→回帰直線→予測
ニューラルネットワーク

Web2.0との関係
アマゾンは本屋でなくても儲かる(アマゾンは本屋ではない)←膨大なデータの蓄積とデータマイニング
グーグルは検索エンジン屋ではない←圧倒的な情報量と情報分析スキル