Subject   : データマイニング(data mining)

カテゴリー : ビジネス


 データマイニング(data mining)
 種々の統計解析手法を用いて大量の企業データを分析し、隠れた関係性や意味を見つけ出す知識発見の手法の総称、またはそのプロセスのこと。「マイニング」は「採掘」の意。データウェアハウスなどに蓄積された膨大なデータを「鉱山」に見立て、そこから未知の知見や規則性という“鉱石”を「発掘する」という意味が込められている。

 データマイニングにおける統計・解析アルゴリズムは、相関ルール、クラスタリング、ニューラルネットワーク、遺伝アルゴリズムなど数多くがある。ビジネスの分野では、「決定木分析(ディシジョンツリー)」で顧客特性や傾向を分析したり、「重回帰分析」で過去の実績データから今後の方向性を予測したりといった形で利用される。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名である。

 市販のデータマイニングツールにはこうした主要アルゴリズムが組み込まれており、また近年のツールには直感的な操作ができるように分かりやすいGUI画面を搭載しているものも多い。データマイニングツールの代表的なベンダは、エス・ピー・エス・エスやSAS Institute Japan、日本アイ・ビー・エムなどが挙げられる。

 データマイニングに取り組む際に注意したいのは、あくまで法則を見つけ出すのはユーザーである点。データマイニングツールの役割は、アルゴリズムに基づき、一定の“仮説”を導き出すことにある。そこからどのような意味を見出し、その仮説を検証できるかどうかは、統計解析や業務に精通したユーザー自身の活動とスキルによるということを忘れないようにしたい。

 ⇒ BSC (バランスト・スコアカード)

[メニューへ戻る]  [HOMEへ戻る]  [前のページに戻る]