データマイニング入門
最近は下火になってきたけど、「Web2.0」なんてのがもてはやされて、その中の技術のひとつとして今でも盛んに使われているデータマイニング。膨大なデータの中から隠れた法則を見つけ出そうという手法のことです。
数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)
- 作者: 岡嶋裕史
- 出版社/メーカー: 光文社
- 発売日: 2006/05/17
- メディア: 新書
- 購入: 27人 クリック: 123回
- この商品を含むブログ (87件) を見る
数式は一切使わず、データマイニングの各手法の概念を簡単に説明している。最初のとっかかりとしてはいい本でないかと思う。
説明に使う事例に身近なものを使う工夫がとても好感持てる。まったく予備知識がない人に向けて理解してもらおうという姿勢があり、「入門」を名乗るだけある内容だ。クラスタ分析を説明する章で出てくる事例はガンダムのモビルスーツだったりする。
文章自体も易しい、楽しいを心がけているのがわかる。
図5-1を見てほしい。数々の先達が地を吐くような思いでかき集めたデータである。ある者は情報の収集とともに討ち死にし、ある者は別の世界へと去った。遅れて生を受けた者はその幸運を喜び、先人の教訓を活かしてより遠くへと羽ばたかなければならない。先人たちの遺産をどのように活用すれば、今を生きるわれわれに幸福がもたらされるのか、それを考えていこう。
説教くさい文章のようだが、図5-1に示されているのは「デートに誘った者たちが残ししデータ」だ。どんな戦略を取ればデートが成功するのか、をこの章で追及しようとしている。もちろんデータマイニングの手法で、だ。
amazonがロングテール戦略を成功させるのに使った「連関規則(association rule)」は第八章で説明されている。
データマイニングに興味があるのなら、この本で簡単にイメージをつかんでから本格的な書籍を手に取るのがいいと思う。