
アソシエーション分析とは?用語・エクセルのやり方を解説
>>無料ダウンロード【お役立ち資料】アソシエーション分析マニュアル
目次[非表示]
はじめに
ここではアソシエーション分析について、基本的な意味や活用場面、実際の手順をわかりやすく解説していきます。
この記事を読んで分かること、できるようになること
●アソシエーション分析の意味、基本知識を習得できる。
●アソシエーション分析のExcelでのやり方を図解で知ることができる。
●アソシエーション分析に関するQ&Aやまとめ資料を、無料でダウンロードできる。
アソシエーション分析とは
アソシエーション分析とは、マーケティングにおいて、主に小売業で効率的な販売施策を立案するために、併売(同時購入)される商品間の関係性(複数のデータ間の連関、関係性)を詳細に分析することです。
※心理学における「アソシエーション」は、連想、連合を意味しますが、マーケティングにおいては上記の意味となります。
アソシエーション分析は、相関分析をはじめとするデータマイニングに包括されます。その中でも、主に小売業(B to C)の購買分析で活用されています。
アソシエーション分析の有名な事例
最も一般的な事例は、1998年、米国の雑誌『Forbes』で紹介されたウォルマートでの購買分析の例です。
新生児が生まれたばかりの家庭では、妻が動けないため夫が仕事帰り、特に週末の金曜日の夜、車で店舗に寄り買い物をするケースが多かったようです。
そのとき、新生児用のおむつと自分が飲むビールを一緒に買うことが多いことがわかりました。
これがマーケットバスケット分析です。このマーケットバスケット分析も、広い意味でアソシエーション分析に含まれると言ってもいいでしょう。
また、アソシエーション分析は小売業だけではなく、広く企業のウェブサイト運営でも活用されています。
アソシエーション分析の目的
アソシエーション分析の目的は、単に併売傾向を把握することだけではなく、効率的な販売施策の立案が目的であり、その目的を達成するためにいくつかの重要な指標を算出していきます。
主な販売施策の代表は、アップセルとクロスセルの2つです。
アップセルとは
アップセルとは、購入された商品よりもさらに高い価格の商品を購入してもらうことです。
アソシエーション分析をすることで、セール施策や購入単価アップのための施策を練ります。
クロスセルとは
クロスセルとは、複数の商品を合わせて販売すること(併売)です。
アソシエーション分析にて併売商品の傾向を掴み、併売傾向が高い商品を近くに陳列する、といった施策をおこないます。このような施策は頻繁に行われています。
先述のビールと紙おむつの事例が代表的ですが、身近な例としては、スーパーの店内にて鍋料理やカレーなどの“テーマ性のある調理シーン“を連想させる売場展開です。調理に必要な野菜や肉類がメイン食材とともにコーナー展開されているシーンは、今や当たり前の光景となっていますね。
アソシエーション分析の4つの指標(2商品『AB』のケース)
支持度(Support)
支持度(Support)とは、顧客全体のうち、商品Aと商品Bが同時に購入される割合を表す指標です。支持度が高くなるほど、商品Aと商品Bが同時に購入される確率は高くなります。
★支持度が高い/低い:商品Aを買うと商品Bを購入する人が多い/少ない
★計算式:支持度=商品Aと商品Bを同時に購入したデータ数÷全体のデータ数
期待信頼度(Expected Confidence)
期待信頼度(Expected Confidence)とは、顧客全体のうち、商品Bが購入される確率です。リフト値(次ページで解説)を算出するための数値でもあります。
★期待信頼度が高い/低い:商品Bを購入する人が多い/少ない
★計算式:期待信頼度=商品Bを購入したデータ数÷全体のデータ数
信頼度(Confidence)
信頼度(Confidence)とは、商品Aを購入した人のうち商品Bも同時に購入した人の割合を表す指標です。双方向性があり、商品Bを購入した人のうち商品Aも同時に購入した人の割合も算出します。
★計算式:信頼度=商品Aと商品Bを同時に購入したデータ数÷商品Aを購入したデータ数
★計算式:信頼度=商品Aと商品Bを同時に購入したデータ数÷商品Bを購入したデータ数
リフト値(Lift)
リフト値(Lift)とは、顧客全体のうち、商品Aと商品Bを同時に購入した顧客が、商品Bのみを購入した顧客の割合と比較して、どれほど多いのかを表す指標です。
目安としてリフト値が「1.0」よりも小さい場合、商品Aと商品Bの関連性が低い(商品Bが単独で買われている)といえます。
リフト値は、売れ筋と判断される商品をどのように扱うかという施策の効率性とも言える指標であり、施策を実施することで、実施しない場合に比べどのくらい持ち上がったのかということになります。
多くの顧客がすでに購入している商品をレコメンドしても、効果は大きくはありません。そのため、レコメンドすることで効果が期待できる商品であるかどうかを、リフト値で判断します。
●計算式:リフト値=信頼度(A⇒B)÷(商品Bの期待信頼度)
リフト値が大きくなるほど、商品Bが単体で購入されるより、商品Aと商品Bが同時に購入される割合のほうが高い、つまり、商品Aの影響で、商品Bが購入される確率が高まっているとみなすことができます。
リフト値が低いと、商品Bが購入されている理由は他にあって、商品Aとの関連性は低いと考えられます。
アソシエーションルールとは
アソシエーション分析に欠かせない「アソシエーションルール」とは、関連性の高い事象間の相関関係(ある事象が発生すると、別の事象も発生する)のことです。
例えば、商品Aと商品Bの同時購買は「A⇒B」と表示します。(この矢印は一方向ですが、AとBとの間には、双方向性がある場合とない場合があります)。
アソシエーション分析結果の活用シーン
アソシエーション分析の結果を活用する主な3つの場面は下記になります。
1.小売店の商品陳列や売場レイアウトの修正
説明が重複しますが、同時に購入される傾向がある商品同士の相関関係を参考に、顧客の購買行動を予測して商品陳列や売場の改善を図ったり、データに基づいてアップセルやクロスセルの効果の底上げをおこないます。
2.ECサイトでのレコメンド
AmazonをはじめとするECサイトのレコメンドエンジンにも、アソシエーション分析が活用されています。
ユーザーの購入履歴からユーザーが興味を持つ可能性の高い商品をレコメンドしています。
3.Webサイトのマーケティング
小売業に限らず、ユーザーが、企業のWebサイトで閲覧したページの組み合わせなどをアソシエーション分析し、そこからアソシエーションルールを抽出して、ユーザーに対して訴求力の高いWebサイトを構築することに活用できます。
Excelを使ったアソシエーション分析
Excelのピボットテーブルと数式を使って、アソシエーション分析をおこなう具体的な手順を説明していきます。
【手順1】4つの指標を算出する(2商品『AB』のケース)
支持度(Support)、期待信頼度(Expected Confidence)、信頼度(Confidence)、リフト値(Lift)の4つの指標を、Excel内で算出しましょう。リフト値(Lift)は、信頼度÷期待信頼度で算出します。
【手順2】ピボットテーブルを使って、データ集計・加工をおこなう(4商品『ABCD』のケース)
集計元となるのは「レシートデータ」です。買い物のお会計で渡されるレシートには、買った商品や金額、購入日時、購入場所など情報が記載されていて、購買実態を知るための情報が詰まっています。
レシート番号は1~10まで(A列1~21行)、購入商品はA、B、C、Dの4商品(B列1~21行)です。以下の通りに操作していきましょう。
①挿入タブをクリック。 ②ピボットテーブルをクリック。(テーブルまたは範囲から(T))を選択。 ③ピボットテーブルのボックスが表示される。 ④「既存のワークシート(E)」を選び、A列とB列の1~21行を範囲指定。 ⑤ピボットテーブルを表示させるセルとしてC列1行をクリック。 ⑥「OK」をクリック。 |
前ページの⑥「OK」をクリックすると、⑤で指定したC列1行に、ピボットテーブルの領域が表示され、右側にピボットテーブルのフィールドが同時に表示されます。 |
ピボットテーブルのフィールドで、「行」に「レシート番号」、「列」と「値」に「購入商品」をドラッグすると、C~H列の1~13行にピボットテーブルが表示されます。 |
【手順3】データの整形をする(4商品『ABCD』のケース)
次に、表示されたピボットテーブルを整形しましょう。
C~H列の1~13行のピボットテーブルをコピーして、J列1行に「値貼り付け」しましょう(J列1行でなくても、任意のセルで構いません)。
「値貼り付け」をしたピボットテーブルの表に、罫線を加えたり、「レシート番号」「商品名」などの名称を入力します(文字の「中央揃え」などの微修正は任意で構いません)。
集計元のレシートデータは1~10までの10枚です。J列15行に「レシート枚数」と入力し、K列15行に「レシート枚数」の合計値を入力します。関数は「=COUNTA(J3:J12)」(J3からJ12までの合計)です。
【手順4】商品同時購入パターンのデータ作成(4商品『ABCD』のケース)
次に、ピボットテーブルデータを基に、商品同時購入パターンのデータを作成しましょう。
Q~W列の1~13行に、商品同時購入パターンの数表を作成します。
ピボットテーブルを整形した左側の表をコピー・ペーストし、表頭の項目名を修正すれば、簡単に作成できます。 R~W列の3~13行データの欄は空白にしておきます。
商品同時購入パターン表の各セルに、数式を入力します(下表はExcelシートの「数式表示」です)。例えば「AとBの同時購入は「A+B」で、数式は「=IF(AND($K3=1,L3=1),1,0)」となります。
数式を入力した商品同時購入パターン表です(「数式表示」のチェックを外した通常の表示です)。
【手順5】アソシエーション分析の指標を算出する(4商品『ABCD』のケース)
アソシエーション分析の指標を算出する数式はシンプルです。双方向性のある信頼度のみ、例えばAとBの同時購入の場合、分母のAとBの同時購入数は同じでも、分子がAの場合とBの場合で分かれます。
この関数を次ページの分析結果のフォーマットの各セルに入力しましょう。
【結果】アソシエーション分析の結果(4商品『ABCD』のケース)
アソシエーション分析結果のフォーマットの各セルに、前ページの数式を入力した結果が右側の表です。
・<支持度>
BとCの同時購入が0.4と最も高く、AとDが0.3で続きます。
・<信頼度>(双方向性あり)
最も高いのは(C⇒B)の0.8です。つまりCの購入者がBを同時に購入するケースが多いということで、逆の(B⇒C)、つまりBの購入者がCを同時に購入するケースを上回っています。
AとDでは、(A⇒D)が0.75で(D⇒A)の0.6を上回っています。
・<リフト値>
施策の効率性が最も高い商品の組み合わせは、支持度、信頼度ともに高くリフト値が1.5と1.333で、1.0を上回っているAとD、BとCの組み合わせということになります。
アソシエーション分析にまつわる、よくある質問
Q:「アソシエーション分析」と「マーケットバスケット分析」の違いは何でしょうか。
マーケットバスケット分析は、例えば、購買データを分析することで、商品間の同時購入パターンを発見したい場合などに使われ、広い意味でアソシエーション分析のひとつに含まれています。
違いとしては、アソシエーション分析では上記だけではなく、4つの指標を算出して購入商品間の関係を詳細に分析するという特徴がある点です。
Q:「アソシエーション分析」と「ABC分析」の違いは何でしょうか。
分析する内容が違います。
ABC分析は、商品A・B・Cを、売上が高い順に棒グラフで「Aランク」「Bランク」「Cランク」と並べて、売上構成比を示す折れ線グラフを加えて比較するという、重点的に販売する商品を把握するための分析手法です。
アソシエーション分析のような、購入商品間の関係を分析する手法ではありません。
Q:Pythonによるアソシエーション分析と、Excelによるアソシエーション分析は、どちらがおすすめでしょうか。違いは何でしょうか。
Excelによるアソシエーション分析の方が易しく、ハードルが低いでしょう。プログラミングの知識がない人にとってPythonによるアソシエーション分析は、少々ハードルが高いです。
2つの違いとしては、Excelでは先述の手順のように、実際のPOSデータと形式が類似したExcel(またはCSV)でのデータを使ったやり方となりますが、Pythonでは「mlxtend」というライブラリを使うことが一般的で、POSデータなど実際の販売データをそのまま使うのではなく、前処理の必要がある点が異なります。
※詳細は、Pythonによるアソシエーション分析のマニュアルを参照して下さい。
無料ダウンロード『アソシエーション分析マニュアル 』
本記事で解説した内容をまとめた資料「アソシエーション分析マニュアル~分析の目的・活用とExcelを使った指標の算出~」は、下記よりダウンロードすることができます(無料)。
おわりに(まとめ)
最後に、ここまで解説してきた内容をまとめました。今一度の確認に活用してください。 |
アソシエーション分析とは、主に小売業において、アップセルやクロスセルなどの効率的な販売施策を立案するため、併売(同時購入)される商品間の関係性を詳細に分析することです。
主に、小売店の商品陳列や売場レイアウトの修正、ECサイトでのレコメンド、Webサイトのマーケティング(小売業にとどまらない)の3つが、アソシエーション分析の結果を活用する主な場面です。
2商品(AB)のケースで分析する場合は、支持度(Support)、信頼度(Confidence)、リフト値(Lift)が3大指標です。リフト値(Lift)を算出するために必要な、期待信頼度(Expected Confidence)もあります。
・支持度(Support):商品Aと商品Bを同時に購入したデータ数÷全体のデータ数
・信頼度(Confidence):商品Aと商品Bを同時に購入したデータ数÷商品Aを購入したデータ数、商品Aと商品Bを同時に購入したデータ数÷商品Bを購入したデータ数
・リフト値(Lift):信頼度(A⇒B)÷(商品Bの期待信頼度)
・期待信頼度(Expected Confidence):商品Bを購入したデータ数÷全体のデータ数
支持度、信頼度の高さとともに、リフト値が「1.0」以上の商品組み合わせを重視します。