catch-img

クラスター分析とは?基本と例をわかりやすく解説


目次[非表示]

  1. はじめに
  2. クラスター分析とは
  3. クラスター分析の種類
  4. クラスター分析にまつわるよくある質問
  5. 無料ダウンロード「クラスター分析の方法・活用マニュアル」
  6. おわりに

はじめに

マーケターにとって、あらゆる分析方法の各特徴を把握し、「いま一番有効的な分析方法はどれなのか?」を、出くわしたシーンに応じて判断できる能力は、とても強みになります。その知っておきたい分析方法のうちの1つが、「クラスター分析」です。

クラスター分析の「クラスター」は、英語のcluster=集団、群れという意味です。顧客分析や市場分析には欠かせない分析方法で、商品開発や販売促進のために利用されています。

ここでは、マーケティング担当者はもちろん、初めてクラスター分析について知りたい方や復習したい方を対象に、基本的な専門用語の意味からアウトプット例までを、分かりやすく解説していきます。

この記事は下記のような方におすすめ

  • クラスター分析の基本について理解したい
  • マーケティング現場で役に立つ分析方法を身に付けたい

クラスター分析とは

クラスター分析とは、色々な特性を持つ変数(データ)を「類似性の指標」(データ・データ群間の距離)をもとにして、似た者同士を集めていくつかのグループ(クラスター)に分類する方法の総称で、マーケットセグメンテーションの有効なツールです。

「マーケットセグメンテーション」

マーケットを、特徴ごとに細分化しグループとしてまとめ、各グループに対する商品開発や販売促進策に資する分析のことです。
消費者の「性年代」「居住地域」など、人口動態的な基準を使ったグルーピングが基本ですが、生活価値観(ライフスタイル)、消費行動など調査をしなければわからない特徴ごとにまとめることがマーケットセグメンテーションです。

そのマーケットセグメンテーションの代表的な分析手法のひとつが、クラスター分析です。

クラスター分析の活用方法

典型的なマーケティングセグメンテーションの活用例は、似通った特徴をもつ消費者のグルーピングです。マーケティング用語の「STP(エスティーピー)」のうちの、「S:セグメンテーション」、「T:ターゲティング」にあたります。

さらに、自社・競合商品の「ポジショニング」(「STP」の「P」、調査データでは商品群)でも活用できる、とても有用な分析手法です。

クラスター分析の種類

クラスター分析には大きく二つの種類があります。階層型クラスター分析非階層型クラスター分析です。

階層型は、距離の近いデータ・データ群のペアを探し出し、それらを一つの群(クラスター)に統合します。サンプル数が少ない場合によく用いられます

非階層型は、事前に決めた数のクラスターにデータを当てはめて分類します。ビッグデータなどサンプル数の多い場合によく用いられます。

階層型クラスター分析

階層型クラスター分析の諸方法

階層型クラスター分析には、変数(データ)間・群間の距離の測り方によって、最近隣法重心法最遠隔法メディアン法群平均法ウォード法に分けられます。

言葉で聞くとどの分析方法も難しく思えますが、各分析法を図で表すと、パッと見で特徴が分かりやすくおすすめです。各図は資料に掲載していますので、ぜひ参考にご覧ください。

>>『階層型クラスター分析』の分析法ごとの違いが分かる図を見る【資料を無料ダウンロード】

階層型クラスター分析の「ユークリッド距離」

階層型クラスター分析では、変数(データ)間の類似度を測る尺度として距離を使い、個体間の距離が近いほど類似度が高いと判断します。統計学では、a地点からb地点までの直線距離をユークリッド距離といいます。

クラスター分析の距離の種類としては、最も一般的な「ユークリッド距離」以外には、「ミンコフスキー距離」「マハラノビスの汎距離」があります。

階層型クラスター分析の手順

階層型クラスター分析の手順には、「データと散布図」や「デンドログラム(樹形図)生成」などが出てきます。具体的な手順は使用する専用ソフトによって異なりますので、ソフトのマニュアル通りに操作していきましょう。

階層型クラスター分析の具体例やアウトプット例(デンドログラム等)

5人の被験者の「性格特性のデータ」を用いた階層型クラスター分析の具体例を、資料としてご用意しました。手順やアウトプット例が掲載されていますので、下記よりダウンロードしてご覧ください。

>>「階層型クラスター分析の具体例を用いた手順(データと散布図、デンドログラム等)」を見る【資料を無料ダウンロード】

非階層型クラスター分析

非階層型クラスター分析の方法

非階層型クラスター分析は、デンドログラムのような階層型分類結果を出力しないクラスター分析の総称で、一つ一つの変数(データ)の距離を測り、少ない変数(データ)から似ている同士をグルーピングしていく階層型とは対照的に、変数(データ)全体を“眺めながら”似ている同士をグルーピングします。

ビッグデータを含めた大規模サンプルを対象とした分析に最適で、階層型との大きな違いとしては、あらかじめクラスター数を決めておく必要があります。

非階層型クラスター分析の代表的手法は、K-means法(K平均法)です。他に超体積法もありますが、実際には、非階層型=(イコール)K-means法といってもいいでしょう。(※「K」には特別な意味はありません)

K-means法とは

ここでは、K-means法の手順例をご紹介します。

1.任意にまたはランダムにk個のサンプル(核)を選ぶ。
2.他のデータを、k個の核のうち最も近いものに紐づけしてクラスターに分ける。
3.各クラスターの重心を新しい核とする。
4.各データを最も新しい核に紐づける。
5.この操作をクラスターの重心が移動しなくなるまで繰り返す。

※ここまでの「非階層型クラスター分析の方法」および「K-means法」の解説は、専用ソフトが行う手順(概念)の解説となります。分析を行う際は、ご自身が利用される各専用ソフトのマニュアル通りに操作してください。

データ生成のイメージ図、アウトプット例(散布図)

非階層型クラスター分析の具体的な手順は、階層型クラスター分析と同様、使用する専用ソフトによって異なります。

下記資料では、K-means法(K平均法)によるデータ生成の分かりやすいイメージ図や、アウトプット例(散布図)をご紹介しているので、合わせてご覧ください。

>>「K-means法の分かりやすいイメージ図、アウトプット例(散布図)」を見る【資料を無料ダウンロード】

クラスター分析にまつわるよくある質問

Q:階層型と非階層型は、どう使い分ければいいのでしょうか?

非階層型が適しているのは、大規模データを扱う場合です。データ数の目安は以下の通りです。
・100サンプル以下:階層型
・100〜300サンプル:階層型と非階層型の両方
・300サンプル以上:非階層型

Q:調査票(質問票)はクラスター分析用に作成する必要があるのでしょうか?

いいえ。通常のアンケート調査の形式で、選択肢は順序尺度、名義尺度、間隔尺度、非例尺度のいずれでも構いません。あらかじめ集計を想定した調査票が必要なSD法とは異なります。

関連記事:SD法のやり方|調査設計、分析方法、事例を分かりやすく解説!

※ダウンロードできる資料では、階層型、非階層型ともに、調査票例を省略し集計表を使っていますが、アンケート調査結果の集計表と同じと考えて問題ありません。

上記の他にも、まだまだクラスター分析に関して知っておきたいQ&Aはたくさんあります。「クラスター分析のデメリットは?」「階層型の場合、最近隣法、重心法、最遠隔法、メディアン法、群平均法、ウォード法のどれを使えば良いのか選ぶのに迷ったときは?」など、下記資料内にて解説しておりますので、ぜひ参考にしてください。

>>クラスター分析に関するQ&Aをもっと見る【資料を無料ダウンロード】

無料ダウンロード「クラスター分析の方法・活用マニュアル」

本記事で解説した「クラスター分析の基礎」についてまとめた資料は、下記よりダウンロードすることができます(無料)。こちらの資料では、記事では紹介できなかった重心法やウォードなどの特徴が分かる図や、アウトプットイメージ適する分析方法の選び方などを掲載しています。
無料ですので、下記よりダウンロードしてご活用いただければ幸いです。


おわりに

ここまで「クラスター分析の基礎」について解説いたしました。クラスター分析は、「見えないデータ」を「見える化」してくれる、有能な分析方法で、その結果からはマーケティングのヒントを得ることが期待できます。基礎を理解して上手に役立てましょう!

もっと簡単で、
もっと自由なアンケートを作ろう

「500円」から始められる

セルフ型アンケートツール「Freeasy」

初心者の方には、分かりやすく! 
経験者の方には、高機能でもっと低コスト且つスピーディーに!
500円から始められる自由で簡単なセルフ型アンケートツール「Freeasy」を
さっそく始めてみませんか?

記事ランキング

ページトップへ