データマイニングとは|リサーチ マーケティング用語集
データマイニング
データマイニングとは、収集された情報の中から、傾向や関連性などの有益な情報を見出す分析手法のことです。
英語ではdata miningと書き、マイニング=採鉱(鉱山から有用な鉱物資源を採掘すること)という意味があることから、データをマイニングする、つまりデータを発掘することを言います。
その中でもマーケティングでよく使用されるのが、テキストデータを対象とする「テキストマイニング」です。
データマイニングでできること
売上予測や市場動向、ある事象の発生予測やデータの類似性から新たな仮説を立てるなど、蓄積されたデータから課題の抽出や相関性を見出すことができ、それらを企業経営に役立てることができます。
そのため、様々な企業がデータ分析に特化した「データマイニングツール」を提供しています。データマイニングを無料で使用することができるものもありますので、下記情報を理解したうえで、自社に合ったツールを検討しましょう。
データマイニングで得られる知識
データマイニングを実施して得られる知識は4つに分類され、これらの頭文字をとって、「DWIKモデル」と呼ばれています。
一般的に、以下1~4の見出しの数字が大きい順番に、有用性の高いもの(「4.知恵」が有用性が最も高い)と判断されています。データマイニングの領域は、データを意味のある情報に変換し、知識を引き出すところまでです。
1.データ(Data):画像・音声・数値などの収集された、整理されていない全ての素材
2.情報(Information):収集されたデータを整理し、カテゴライズしたもの
3.知識(Knowledge):情報の分析結果から得られる傾向・知見
4.知恵(Wisdom):知識を活用して、物事を判断する力
データマイニングの手順
データマイニングの手順は「収集」「加工・整理」「分析」「検証・評価」の4ステップです。
1.定めた目的に沿ったデータ収集
データマイニングを効果的、かつ効率的に実施するためには、目的に沿ったデータを大幅に収集することが重要です。ビッグデータさえあれば大丈夫ということではありません。
データ収集の目的を明確に定め、その目的に応じたデータを用意する必要があります。
2.収集データの加工・整理
収集したデータに含まれている「ノイズ」が影響するため、そのまま分析を行うことはできません。
データがある程度揃ったら、「データクレンジング」という加工を行います。その加工で欠損値や外れ値などのデータを除去してバラツキをおさえることで、システムでの分析がよりスムーズに出来るようになります。
加工時に、データ解析の作業がしやすいようデータの形式を統一したり、データの重複がないように「正規化」の加工を施したりします。
3.データのパターンや関連性などの分析
「クラスタリング」や「ロジスティック回帰分析」などの手法を用いて、整理したデータをグループ化し、それぞれのグループごとの特徴を分析して、データの性質・相関関係などを調査します。
4.分析結果の要因特定、効果検証・評価
データマイニングにより分析した後は、 その結果から要因を特定します。
さらに検証結果を基にルールを作成・仕組み化し、それを実際のデータに当てはめて、データマイニングの効果検証・評価することも不可欠です。
また、異なる収集データを用いても同じように機能するかなども検証し、信頼性や精度の評価を行うことが求められます。
データマイニングの手法
データマイニングで主に用いられる分析手法は3つあります。
1.クラスタリング
データの類似性に基づいてグループ分けする手法です。分けられた各グループは、「クラスター」と呼ばれます。
購買データを基に、似通った購買行動をしている顧客をグループ化し、それぞれのグループごとに異なるマーケティング施策を実施する場合などに役立ちます。
2.ロジスティック回帰分析
特定の事象が起きる確率を予測する分析手法です。二択の結果(例:「Yes」「No」)を明確に定義できるものを分析する場合に適しています。
3.マーケット・バスケット分析
小売店の販売データから、一緒に購入される商品の組み合わせを見つける際に活用される手法です。
一見関係がないように見えて、実は同時に購入されることの多い商品や、逆に関連商品のように思えても同時に購入されることが少ない商品を明確にすることで、効果的な陳列方法や売り方の施策検討に役立ちます。
関連用語
関連記事
「データマイニング」と関わりの深い「相関分析」について解説している記事も、合わせてご覧ください。
⇒相関分析をわかりやすく解説!基本、エクセルのやり方、事例