決定木分析とは?マーケティングにおける活用方法を解説!
目次[非表示]
はじめに
ここでは決定木分析(デシジョンツリー/decision tree)について、基本知識、分析の具体的な進め方について、事例を交えながら、分かりやすく解説していきます。
この記事を読んで分かること、できるようになること
●決定木分析の意味、基本知識が理解できる。
●決定木分析の図の見方・やり方を理解し、自分でおこなうことができるようになる。
●決定木分析に関するQ&Aやまとめ資料を、無料でダウンロードできる。
決定木分析(デシジョンツリー/decision tree)とは
決定木分析とは、データを階層(ツリー)構造に分岐させ、各階層ごとにデータを分析することで、マーケティングの意思決定に役立てることができる分析手法です。統計学と人工知能分野の折衷により生まれた手法で、マーケティング分野でも多く活用されています。
「けっていぎぶんせき」と読み、デシジョンツリー(decision tree)とも言います。
決定木分析は、医療、金融をはじめとする多岐に渡る分野で活用されていますが、ここではマーケティングにおける活用を軸に解説していきます。具体的には、ある架空のスーパーの顧客調査結果から、購入の継続と離反を分析し、継続(リピート)してくれるための施策を、どのタイミングで行うのがいいのか、というケーススタディを取り上げます。
決定木の全体イメージ図
まずは全体像を見てみましょう。こちらは決定木の分析結果例で、架空のスーパーの顧客分析例となります。詳しくは次から順に説明していきます。
決定木の「ノード」と「ブランチ」
決定木では以下の四角いボックスをノードと呼びます。
【ノード0】は、分岐の始まるノードなのでルートノードと呼びます。
【ノード6】から【ノード9】は分岐の最終到達点で、ターミナルノードと呼びます。
そしてノード同士をつなぐ線をブランチと呼びます。
決定木の作成方法
決定木の作成手順
・Excelなど表計算ソフトのクロス集計結果をツリー状に記述して分析
・SPSSなど有償の統計ソフト
以上が一般的であり、簡単に作成する方法の1つですが、作成手順は特に決まっているわけではありません。詳しくは各統計ソフトのマニュアルを参照して作成していきましょう。
なお最近では、AIモデル、具体的にはPython(パイソン)を使うケースも増えています。
決定木を作成するときの注意点
決定木分析では最初にルートノードを設定し、階層別にノードを追加していきますが、分岐が多くなること、つまり細分化し過ぎないようにしましょう。
なぜなら、
・分析が複雑になってしまうこと
・対象者の数が少なくなること
が懸念されるからです。
後述の「決定木分析のケーススタディ」では最下層のターミナルノードは4つです。基準の粒度として参考にしてください。
決定木分析のケーススタディ(具体的な分析のやり方)
ここからは、ノード別の分析例を順番に解説していきます。再掲となりますが、決定木の全体イメージ図はこちらです。
ノード別の分析例|【ノード0】~【ノード2】
まずはじめに、架空のスーパーの顧客を分析したルートノードの【ノード0】から解説します。
【ノード0】を見ると、分析対象顧客のうち、購入を継続したのは54%、離反したのは46%であることが分かります。ほぼ5:5の比率です。
ただ、この結果だけでは分析はできません。そこで、ほぼ5:5の比率である継続者と離反者を、クーポン利用と非利用に分けて分析しましょう。
次の階層の【ノード1】はクーポン利用者、【ノード2】はクーポン非利用者です。
クーポン利用者と非利用者の比率は4:6で、利用者のほうが少ない結果でした。ただし、クーポン利用者のうち8割は購入を継続しており、クーポン非利用者における継続の3割強を大きく上回っています。
この結果から言えることは、クーポン非利用者に対しては、割引の働きかけを工夫することで、来店の可能性を高められるかもしれないということです。
ノード別の分析例|【ノード2】~【ノード5】(クーポン非利用者)
続いて【ノード2】のクーポン非利用者を見ると、36%は継続しているものの、64%もの顧客が離反していることがわかります。
次の階層である【ノード3】から【ノード5】は、クーポンを利用しなかった顧客の来店日ごとの継続・離反の比率と人数です。
【ノード3】の「特売日」の来店者を見ると、継続率は57%で離反率は43%に下がっています。つまり、クーポン券を利用していなくても、「特売日」に来店した顧客は57%が継続して来店しているということです。
よって、クーポン非利用者に対しては「特売日」の来店を促進するための広告などの施策が重要ということになります。【ノード1】から【ノード2】の分析結果で出た割引の働きかけは、具体的にいうと「特売日」の割引の告知になります。
ノード別の分析例|【ノード3】~【ノード9】(クーポン非利用者)
【ノード3】から【ノード5】は、クーポン非利用者の「特売日」「週末」「その他」の来店状況、次の階層である【ノード6】から【ノード9】は、「感謝デー」の来店状況です。
「感謝デー」に来店したかしなかったかによる、継続と離反への影響の大きさが、よく分かります。
特に【ノード6】を見ると、クーポンを使わなくても「特売日」「感謝デー」に来店した顧客の84%は継続しています。
また【ノード7】を見ると、クーポンを使わず、「特売日」に来店したものの、「感謝デー」に来店しない顧客は、その後、ほぼ来店することはない(離反が80%)との予想が可能です。
このような特徴の顧客がデータ上で発見されたならば、特売を知らせるクーポン付きのダイレクトメールを送るなど、離反を抑える施策(アクション)をとるのも有効でしょう。
ノード別の分析例│全体(結果のまとめ)
決定木の活用シーン
決定木分析が活用される代表的なシーンは、医療・金融分野です。
医療分野では、患者の診断や疾患のリスク評価に決定木分析が採用されています。病気の早期検出や治療計画の最適化が目的です。
金融分野では、信用評価や顧客の信用スコアを予測するために決定木分析が採用されています。信用リスクを管理し、貸し倒れを減少させることが目的です。
また、近年、EC小売業者が活用するケースも増えています。特定の商品を購入する可能性が高い顧客セグメントの特定と、ターゲット広告キャンペーンの最適化が目的です。
決定木分析にまつわる、よくある質問
Q:重回帰分析との違いは何でしょうか。
決定木分析と重回帰分析では、「目的」が違います。
重回帰分析の主な目的は、「売上予測」をはじめとする予測です。そしてどのような要素(説明変数=独立変数)がどの程度、売り上げなど目的変数(従属変数)に影響するのか、などの計算式を算出することです。
決定木分析は、重回帰分析とは逆に、目的変数を「ルートノード」として、従属変数へ「下って分析」していきます。また、重回帰分析のように結果を予測する計算式を算出することなく、例えばどの「段階」でどのような「顧客」にどのような「アクション」をすればいいのかが分かること、が目的となります。
Q:決定木分析のメリットとデメリットは何でしょうか。
最大のメリットは、具体的なマーケティングアクションに直結する分析結果が得られることです。
反対にデメリットは、重回帰分析のような精度の高さがないことです。しかし決定木分析の目的を考えると、精度の低さというデメリットを補うだけのメリットが得られるでしょう。
無料ダウンロード『決定木分析の解説~マーケティング分析のケーススタディ~ 』
本記事で解説した内容をまとめた資料「決定木分析の解説~マーケティング分析のケーススタディ~ 」は、下記よりダウンロードすることができます(無料)。
おわりに(まとめ)
最後に、ここまで解説してきた内容をまとめました。今一度の確認に活用してください。 |
決定木分析(デシジョンツリー/decision tree)とは、データを階層(ツリー)構造に分岐させ、各階層ごとにデータを分析することで、マーケティングの意思決定に役立てることができる分析手法です。
売上予測をはじめとする重回帰分析とは異なり、決定木分析の目的は、例えば購買プロセスのどの「段階」でどのような「顧客」にどのような「アクション」をすればいいのかが分かるということであり、これが最大のメリットでもあります。
活用されている場は幅広く、マーケティング分野ではもちろん、医療・金融分野でも重宝されており、近年ではEC小売分野で活用されることも増えてきています。
【参考文献】
『購買心理を読み解く統計学ー実例で見る心理・調査データ解析28』(豊田秀樹著、東京図書、2006年6月)