コレスポンデンス分析とは│やり方を事例でわかりやすく解説
目次[非表示]
はじめに
ここではコレスポンデンス分析について、その特徴、やり方、アウトプットイメージを、事例を交えながらわかりやすく解説していきます。
この記事でわかること・できること
●コレスポンデンス分析の基本とアウトプットイメージがわかる。
●Excel統計を使ったコレスポンデンス分析結果例を見ることができる。
●コレスポンデンス分析に関するQ&Aやまとめ資料を、無料でダウンロードできる。
コレスポンデンス分析とは
コレスポンデンス分析とは、2次元のマップ上で、回答パターンが「関連性が強い=似ているもの同士を近く」に、「関連性が弱い=傾向の異なるものを遠く」にプロット(布置)する分析手法です。プロットした点同士の距離を見ることで、関係の強弱を視覚的に把握することができます。
アンケート調査結果やクロス集計表を見やすくするために使われます。例えば、アンケート調査で得られたブランドイメージなどを2次元にマッピングするときなどによく用いられています。行数や列数が多くて見づらいクロス集計表を可視化できるため、データが理解しやすくなります。
略して「コレポン」と呼ばれることもあり、「対応分析」や「数量化Ⅲ類」と同義です。
コレスポンデンス分析のメリット
最大のメリットは、「あるブランドは、どのイメージと結びつきが強いのか」などのように、データを感覚的に俯瞰できることです。
また、クロス集計表は項目が多く複雑なことが多いため、それを視覚化でき、一目で分かりやすくなることも大きなメリットです。
さらには、分析に必要なデータはクロス集計のみなので、比較的容易に分析を行うことができます。
コレスポンデンス分析のデメリット・注意点
コレスポンデンス分析にかけるデータは集計済みのクロス集計表ですので、値の大小はアウトプットのマップには反映されません。 データ間の「形」は一目でわかっても、各々のデータの「強さ」まではわかりませんので、データの解釈には注意が必要です。
主成分分析やクラスター分析との違い
コレスポンデンス分析に似ている分析方法として、「主成分分析」と「クラスター分析」があります。それぞれの分析手法について簡単に説明します。
主成分分析は、観測できる変数に内包されている情報を、できるだけ損なわずに少数の変数(主成分)に縮約します。経済学や社会学領域で多く用いられています。
企業イメージや、ブランドイメージ測定、製品のイメージ評価などでよく利用されているSD法の目的に適している分析手法です。
>>【関連記事】「SD法と主成分分析」について詳しく解説
クラスター分析は、色々な特性を持つ変数(データ)を「類似性の指標」(データ・データ群間の距離)をもとにして、似た者同士を集めていくつかのグループ(クラスター)に分類する方法の総称です。
マーケットセグメンテーションの代表的な分析手法の一つです。
>>【関連記事】「クラスター分析」について詳しく解説
コレスポンデンス分析のやり方
コレスポンデンス分析の手順は下記のとおりです。
〈1〉コレスポンデンス分析の目的を明確にし、クロス集計表を準備する
コレスポンデンス分析は、集計済のクロス集計表を使うことが最も一般的です。
例えば、『表側にブランド名、表頭にブランドのイメージワード』があるクロス集計表【例①】、『表側にある一つのブランドのイメージワード、表頭に性年代別のスコア』があるクロス集計表【例②】などです。
〈2〉ツールを利用してコレスポンデンス分析にかける
エクセル統計や無料ソフトの「R」、有料ソフトの「SPSS」や「JMP」などを利用して、コレスポンデンス分析を実行します。
〈3〉分析結果を散布図にして、解釈する
分析結果のデータをエクセルにコピーし、メニューバーの「挿入」→「グラフ」→「散布図」をクリックすれば、散布図が作成されます。ラベルの表示やフォントなどを見やすく整えて、解釈に進みましょう。
コレスポンデンス分析の事例
ある商品カテゴリーについて、A~Iまでの9つの店(ショップ)のイメージを聞く設問を取り上げ、事例としてご紹介していきます。
〈1〉コレスポンデンス分析に用いるクロス集計表の準備
下記のようなクロス集計表の場合、このまま9つのショップ名と12のイメージをそのままプロットし、全体像を俯瞰することもできます。
しかしここでは「各イメージごとに性年代別の傾向を深堀する」という調査目的に沿い、『ショップに行くことにステイタスを感じる』というイメージを一つの例として、性年代別の傾向を分析してみましょう。
『ショップに行くことにステイタスを感じる』の性・年代別のクロス集計表が下記です。性・年代区分は、男女とも「15~19歳」「20代」「30代」「40代」「50歳以上」の5区分です。
こちらのデータはパーセンテージ(%)ですが、実数でもかまいません。
〈2〉コレスポンデンス分析結果の固有値(Excel統計)
先述の性・年代別クロス集計表をExcel統計(有償)でコレスポンデンス分析にかけた結果、3つの票が自動的に生成されました。
固有値(行方向・列方向)が、左側の上下2つの表です。右側は第1固有値と第2固有値の値が合体した表です。
〈3〉コレスポンデンス分析結果のアウトプットと解釈
行方向・列方向の第1固有値と第2固有値が合体された表(再掲・下記左側の表)を、散布図としてプロットしたコレスポンデンス分析のアウトプット例がこちらです。この散布図もExcel統計(有償)で自動的に生成されます。
軸の名称は結果を解釈しながら決めます。
今回の例ではX軸を「回答者の年齢(高年齢⇔低年齢)」、Y軸を「ショップの形態(国内系⇔外資系)」としました。
その結果、
・最も平均的なX軸とY軸の中央付近は、男女とも20代・40代と女性15~19歳。 ・ショップは大型店を含むC,D,F。 ・男女とも30代は外資系のショップAとB。 ・男女とも50歳以上は国内系の老舗ショップE,H,I。男性15~19歳は国内系のショップG。 |
以上のように、ステイタスを感じるショップの性・年代別傾向が明らかになりました。
コレスポンデンス分析にまつわる、よくある質問
Q:「コレスポンデンス分析」と「数量化Ⅲ類」は同義とのことですが、違いはありますか。
基本的に同じと考えて差し支えありません。微妙な違いとしては、数量化Ⅲ類の場合、分析に用いるクロス集計表の値が「0-1」の2値データ( 「あてはまらない」場合は「0」、「あてはまる」場合は「1」)であるという点です。
どちらも、データ間の相関係数が最大になるように分析することが原理です。「コレスポンデンス分析は数量化Ⅲ類の拡張」という言い方もできるでしょう。
※クロス集計表の値は実数を使うケースが多いですが、今回の例のように構成比(%)でも結果は変わりません。
Q:散布図のX軸とY軸の名称は、決めなければいけないのでしょうか。
軸の名称を決めることも大切な分析です。先述の事例では、X軸が「調査対象者の年齢」(高年齢⇔低年齢)、Y軸が「ショップの特性(国内系⇔外資系)」と明瞭に定義できましたが、実際にはこのように明瞭に分けられるケースばかりではありません。柔軟に考えて決めましょう。
Q:散布図において、X軸とY軸が交差する中央付近は「際立った特徴がない」ということをよく聞きますが、それは正しいことでしょうか。
その解釈で間違いはありませんが、「際立った特徴がない」ということは「マス(多数派)から最も支持されたり親しまれる」という言い方もできるでしょう。
コレスポンデンス分析のアウトプット散布図では、各々のデータの「強さ」は分かりませんが、実際のところ高スコアのデータが中央付近にプロットされやすい傾向はあります。
無料ダウンロード「コレスポンデンス分析の方法・活用マニュアル」
本記事で解説した「コレスポンデンス分析の方法・活用」についてまとめた資料は、下記よりダウンロードすることができます(無料)。
まとめ
ここまでコレスポンデンス分析の基本的なやり方や、活用場面を、具体例とともに解説してきました。コレスポンデンス分析をおこなうと、クロス集計表が2次元のマップに変換され、ぱっと見でその関係性を知ることができます。使いこなして、マーケティング活動に活かしていきましょう。
【参考文献】
『課題解決! マーケティング・リサーチ入門』(田中洋編著、リサーチナレッジ研究会著、ダイヤモンド社、2010年)/『ピタリとわかる多変量解析入門』(涌井良幸、涌井貞美共著、誠文堂新光社、2005年7月)