catch-img

アンケート集計と分析の基本|Excelを活用したまとめ方を解説


目次[非表示]

  1. はじめに
  2. 単純集計表の作成
  3. クロス集計表とグラフの作成
  4. Excelの「分析ツール」
  5. 基本統計量
  6. 相関と回帰分析
  7. まとめと留意点
  8. 資料ダウンロード「エクセルでできるアンケートの集計と分析のやり方」
  9. おわりに

はじめに

マーケティングにおいて、アンケート実施後の集計・分析作業は非常に重要です。しかし、できるだけ時間をかけずに、コストもおさえて実施したいですよね。

そこでおすすめしたい方法が、エクセル(Excel)を利用した集計・分析です。この記事では、単純集計表、クロス集計表作成方法から、グラフ化、分析ツールの使い方、相関分析・回帰分析について、分かりやすく解説していきます。

この記事を読んで得られること

  • Excelを使った単純集計表、クロス集計表とグラフ作成方法についてわかる
  • 基本統計量や相関・回帰分析の基本とExcelを使ったやり方がわかる
  • 画像付きでよりわかり易い資料がダウンロードできる

この記事をおすすめしたい方

  • はじめてアンケート調査やネットリサーチを実施する方
  • Excelを使ってアンケートの集計と分析を行いたい方
  • アンケート結果をうまく活用したいと思っている方

アンケートの作成方法が知りたい方は、アンケートの作り方|4つのコツと質問例(テンプレート)を大公開をご覧ください。

単純集計表の作成

アンケート実施後、その結果を活用できる形にするためには、「単純集計」や「クロス集計」という集計方法で、データを処理していきます。

まず最初に、「単純集計表」のエクセルでの作成方法について説明していきます。
>>【専門用語】単純集計とは?
>>【専門用語】クロス集計とは?

アンケート調査の設問

設問は以下の2問です。集計方法のみ解説いたしますので、選択肢数は絞り込み、「その他」の自由回答などは省略しています。

【Q1】あなたが最も好きなエナジードリンクを以下のうちからお選びください。(ひとつだけ)

1.商品A / 2.商品B / 3.その他 / 4.あてはまるものはない

【Q2】あなたがQ1で選んだエナジードリンク剤を購入するのは、どのオンラインショップですか? 以下のオンラインショップのうちあてはまるものをすべてお選びください。(いくつでも)

1.ショップA / 2.ショップB / 3.ショップC / 4.その他 / 5.あてはまるものはない

ローデータと単純集計のアウトプット

では、アンケート調査のローデータから単純集計表を作ってみましょう。
>>【専門用語】ローデータとは?

単純集計(GT)とは、各設問の選択肢の数と割合(%)をそのまま集計した結果です。

ローデータの項目とデータ形式

下記は、アンケート調査のローデータです。

表頭は「番号」「性別」「年齢」「婚姻状況」「子供の有無」、以上A列~E列が回答者の属性です。

F列(Q1)の「最も好きなエナジードリンク」は、単一回答です(選択肢は1~4まで)。
Q2_1からQ2_5は複数回答で、例えばQ2_1が選ばれた場合は「1」、選ばれなかった場合は「0」が入っています(ダミーデータとも呼ばれています)。
全回答者数は400人ですので、「番号」列は400まで続いています。

単純集計表のフォーム

「ローデータ」とは別シートに、「単純集計表」のシートを用意します。
単純集計表に必要な項目をリストアップし、各々、表のフォームを作成します。
回答者数は400人ですので、実数の「全体」欄には「400」を入力しておきます。

性別集計のCOUNTIF関数

まず初めに「性別」の単純集計を算出してみましょう。使用するのは「COUNTIF」関数です。

男性とともに女性のセルにも、COUNTIF関数と計算式(構成比の算出)を入力します。

関数は手で入力してもかまいませんが、「関数ライブラリ」から入力することもできます。
>>『関数ライブラリの使い方』を見る【資料を無料ダウンロード】

他属性もCOUNTIF関数で集計

「婚姻状況」と「子供の有無」も「性別」と同様、COUNTIF関数による単純算出が可能です。

単数回答データの単純集計表

次に、単数回答(単一回答)の単純集計のやり方です。
>>【専門用語】単一回答(シングルアンサー)とは?

『【Q1】 好きなエナジードリンクの銘柄』の選択肢は、「1.商品A」から「4.あてはまるものはない」までの4段階です。「Data」シートのF列2行目から401行目までの範囲で、それぞれ1から4までの数値をカウントすれば単純集計が完成します。

複数回答データの単純集計表

複数回答の単純集計でも同じく「COUNTIF」関数を使います。
>>【専門用語】複数回答(マルチプルアンサー)とは?

『【Q2】好きなエナジードリンクの購入オンラインショップ』では、5つの選択肢が「Q2_1」から「Q2_5」まで1列ずつ「0,1」のダミーデータ形式となっています。ですから、「1」のデータの個数を加算すれば実数が算出されます。

年齢を年代にグループ化(COUNTIFS関数)

順序は前後しますが、1歳毎の年齢を「20代」などの年代にまとめて単純集計表を作る方法です。
使う関数は「COUNTIF」の末尾に「S」がついた「COUNTIFS」関数です。

合わせて、「ピボットテーブルによる集計のやり方」も知っておくと非常に重宝します。
あらかじめフォームを作り、関数で算出したほうが便利ですが、関数で算出したデータの検証のためにピボットテーブルを使うケースもあります。ピボットテーブルの使い方は、資料にて画像付きで詳しく紹介していますので、ぜひ参考にしてください。
>>『ピボットテーブルによる単純集計のやり方』を見る【資料を無料ダウンロード】

​​​​​​​

クロス集計表とグラフの作成

アンケート調査の設問

単純集計表に続き、クロス集計表を作成してみましょう。先述の「単純集計表の作成」と重複しますが、設問を再掲載いたします。

>> クロス集計の基本やコツが知りたい方は、【クロス集計のやり方】基本から活用例までわかりやすく解説をご覧ください。

【Q1】あなたが最も好きなエナジードリンクを以下のうちからお選びください。(ひとつだけ)

1.商品A / 2.商品B / 3.その他 / 4.あてはまるものはない

【Q2】あなたがQ1で選んだエナジードリンク剤を購入するのは、どのオンラインショップですか? 以下のオンラインショップのうちあてはまるものをすべてお選びください。(いくつでも)

1.ショップA / 2.ショップB / 3.ショップC / 4.その他 / 5.あてはまるものはない

クロス集計のアウトプット

この例では実数と構成比(%)を別表にしてありますが、一つの表の上部に実数、下部に構成比(%)を配置するケースも少なくありません。

表側の項目は「全体」の他、「性別」「性年代」「婚姻状況」「子供有無」の4項目を「クロス集計軸」としました。

「クロス集計軸」は通常、「集計軸」と呼ばれていますが、調査目的を達成するために、どのような属性の人々のデータが必要か? という重要な項目です。

集計軸」はアンケートの配信前、調査設計時に決めておくことが理想的です。なぜなら、調査目的達成のため、必要な属性の人たちのデータを、どの程度回収できるか? を把握しておく必要があるからです。
この集計軸の場合、性年代で男女とも「50代」の回答者数が各々28名、17名と一般的に集計に必要とされる最低限の30名を下回っており(*2)、「男性50代」と「女性50代」は、レポート(報告書)では「参考値」としなければなりません。

ローデータの加工

集計軸となる項目の列を加えます。クロス集計ではローデータの加工が必要となります。単純集計表の年代では関数を使い、年齢から算出しましたが、クロス集計では表側の集計軸となるため、あらかじめデータを作成する必要があります。


単数回答のクロス集計表

以下は「商品A」の各セルに入る関数です。「全体」のみ「COUNTIF」関数、他の集計軸は全て「COUNTIFS」関数となります。
「商品B」「その他」「あてはまるものはない」は、この関数をドラッグして貼り付け、最後の数字をそれぞれ「,2)」「,3)」「,4)」と手入力で上書きします。

複数回答のクロス集計表

以下は「ショップA」の各セルに入る関数です。「全体」のみ「COUNTIF」関数、他の集計軸は全て「COUNTIFS」関数となるのは、前述の単数回答と同様ですが、複数回答は「0,1」のダミー変数なので、「1」の個数をカウントすることになります。

以下は「ショップB」の各セルに入る関数です。前述の「ショップA」と同様ですが、「ショップB」は「L列」なので「1」の合計がカウントされるのは「L列」です。

以下は「ショップC」の各セルに入る関数です。前述の「ショップA」と同様ですが、「ショップC」は「M列」なので「1」の合計がカウントされるのは「M列」です。

以下は「その他」の各セルに入る関数です。前述の「ショップA」と同様ですが、「その他」は「N列」なので「1」の合計がカウントされるのは「N列」です。

以下は「あてはまるものはない」の各セルに入る関数です。前述の「ショップA」と同様ですが、「あてはまるものはない」の合計がカウントされるのは「O列」です。

単数回答のクロス集計表のグラフ化

続いて、「単数回答」のクロス集計表の、データのグラフ化を試みます。
構成比(%)のクロス集計表のデータをそのままグラフの参照元とするのではなく、グラフ作成用の表を作成し、クロス集計表の構成比(%)を「参照」させます(「値貼り付け」でもかまいません)。

ここでは、「性年代別」のグラフを作成してみます。合計が100%になるデータの比較なので帯グラフにします。

「挿入」画面で、グラフ作成用の表を「範囲指定」して「グラフ」の右下をクリック、「すべてのグラフ」から「横棒」「100% 積み上げ横棒」をクリックします。
ここまでの処理が終わると、デフォルトで帯グラフが作成されます。

次に、デフォルトで作成された帯グラフを整形してみます。
グラフの整形は、グラフエリアの中の該当する箇所をクリックしアクティブ化、右クリックで「書式設定」のボックスが画面右側に表示され、そこで操作します。

1) グラフエリアの塗りつぶしと枠線を消します。
2) タイトルを手入力します(「グラフ タイトル」にそのまま上書きします)。
3) クロス表と同じように「全体」が最上部、「女性50代」が最下部になるよう、「軸の書式設定」で「軸を反転」させます。
4) 凡例の表示位置を最下部から最上部にします。
5) グラフの色(トンマナ)がうるさいので、寒色系に変えます。
6) データラベル(%の数字)を入れるため、グラフの帯の幅を広げます。
7) データラベル(%の数字)を入れます。

↓上記の手順で作成した単数回答のクロス集計表のグラフ

>>画像付きの資料で『単純回答のクロス集計表のグラフ化』や『グラフの整形方法』を見る【資料を無料ダウンロード】

複数回答のクロス集計表のグラフ化

「複数回答」のクロス集計結果のグラフ化も、「単純回答」の時と同様に、構成比(%)のクロス集計表のデータをそのままグラフの参照元とするのではなく、グラフ作成用の表を作成し、クロス集計表の構成比(%)を「参照」させます(「値貼り付け」でもかまいません)。

ここでも「性年代別」のグラフを作成してみます。合計が100%にはならないデータの比較なので折れ線グラフにします。

属性の中の比較、例えば男性の中でどのオンラインショップでの購入が多いのか?を比較するのには棒グラフが適していますが、ここでは属性の間の比較、例えば「男性20代と30代の間でのショップ購入の違い」にフォーカスを当てるため、折れ線グラフとします。

「挿入」画面で、グラフ作成用の表を「範囲指定」して「グラフ」の右下をクリック、「すべてのグラフ」から「折れ線」「100% 積み上げ横棒」をクリックします。

グラフ作成用の表をそのまま折れ線グラフにすると、デフォルトで折れ線グラフが作成されます。次に、デフォルトで作成された折れ線グラフを整形します。

1) グラフエリアの塗りつぶしと枠線を消します。
2) タイトルを手入力します(「グラフ タイトル」にそのまま上書きします)。
3) 凡例の表示位置を最下部から最上部にします。
4) 折れ線の色(トンマナ)を変えます。
5) データラベル(%の数字)を入れます。
6) その他、軸の項目名や目盛りラベルの文字の大きさを微調整します。

※書式設定は、単純回答の帯グラフの整形の場合と基本的に変わりません。グラフの軸や折れ線などをクリックし、アクティブにしながら、「書式設定」のボックスの項目を調整してみてください。

>>画像付きの資料で『複数回答のクロス集計表のグラフ化』『グラフの整形方法』や『ピボットテーブルによるクロス集計のやり方』を見る【資料を無料ダウンロード】


Excelの「分析ツール」

集計が完了したら、次は分析をおこないます。「分析」という言葉を聞くと、統計学など難しい内容を思い浮かべるかもしれませんが、実際には難しく考える必要はありません。
特に今から解説する、エクセルに備わっている「分析ツール」を活用すれば、誰もが分析をおこなうことが可能です!

Excelの分析ツールの表示方法

エクセルで相関分析回帰分析を行うには、「分析ツール」を表示させる必要があります。
ここでは、Excelの「分析ツール」を使うための設定について解説いたします。
>>【専門用語】相関分析とは?
>>【専門用語】回帰分析とは?

以上の手順で、Excelの「データ」画面で、「データ分析」ツールが使えるようになりました。画面右側の「データ分析」をクリックすると、「データ分析」のボックスが表示されます。

基本統計量

エクセルの「データ分析」において、「基本統計量」という言葉をまずは知っておきましょう。
「基本統計量」とは、そのデータの特性(基本的な特徴)を表す数値のことです。そのデータが全体的にどのような特徴があるのかを把握することができ、この基本統計量をもとに、データを分析していくことができます。

アンケート調査の設問

例として、ここでは、アンケート調査結果の統計情報を確認し、相関と回帰分析を試みます。
設問は以下の2問です。集計方法のみ解説いたしますので、選択肢数は絞り込み、「その他」の自由回答などは省略してます。

【Q1】あなたはこの飲料○○○○をどの程度好きですか。(ひとつだけ)

1.非常に好き / 2.好き / 3.やや好き / 4.どちらともいえない / 5.やや嫌い / 6.嫌い / 7.非常に嫌い

【Q2】あなたが感じる飲料○○○○の印象を教えてください。(いくつでも)

<香味特性>

香り / 苦み / 甘み / 酸味 / 味の濃さ / 飲みごたえ / 後味 / 口当たり / まろやかさ / すっきり / 軽さ / クセ


<選択肢>

1.とてもそう感じる / 2.そう感じる / 3.ややそう感じる / 4.どちらともいえない / 5.あまりそう感じない / 6.そう感じない / 7.とてもそう感じない

ローデータの加工

全回答者数は400名ですので、ローデータの行数は401行、A列の「番号」は400まで続きます。
C列の「好意度」、D列からO列の「香味特性」はともに、選択肢の値が小さいほど評価が高く、大きいほど低評価でした。

相関や回帰分析を行う上で、値が大きいほど評価が高いほうが分かりやすいので、以下のローデータでは、好意度、香味特性ともに「1」が最も低評価で「7」が最も高評価となるようにデータを変換してあります。
※相関や回帰分析を行う場合、あらかじめ調査設計時に、好意度と香味特性の選択肢のスケール(7段階の選択肢など)を合わせておく必要があります。

基本統計量の算出

それでは、データの全体像である「基本統計量」を算出してみましょう。
基本統計量では、平均値をはじめとして「代表値」が表示されます。

まず、【Q1】の「好意度」の基本統計量を表示させてみます。「データ」画面で「データ分析」をクリックすると「データ分析」のボックスが表示されます。ここで「基本統計量」を選び「OK」をクリックします。

「基本統計量」のボックスでは、まず「入力範囲」を指定します。「好意度」はC列1行から401行までが範囲です(絶対参照の「$」は自動的に付けられます)。
「先頭をラベルとして使用(L)」「統計情報(S)」も忘れずにチェックします。

基本統計量の主要指標

データ分析を行う場合、真っ先に平均値(算術平均)を求めることが一般的ですが、もし、「中央値」や「最頻値」と大きく離れていたら要注意です。
データがどの程度、散らばっているのかの重要指標が「分散」です。ただし「分散」は計算過程で数値を2乗しているので、単位を変えてわかりやすくし重宝される指標となっているのが「標準偏差」です。
平均値から標準偏差±1個分の範囲内に7割のデータがある」といったように表現されることもあります。

分散と尖度

前述のとおり、データのバラつき具合を見る指標は「標準偏差」ですが、その素は「分散」です(「分散」を他指標と比較しやすい単位に計算したのが「標準偏差」)。

分散」が大きいとデータはより広くバラつき、小さいとバラつきは狭くなり、代わりに「尖度(せんど)」は低くなります。
尖度」が低くなるということは、右下のグラフ上では頂点が高く尖った形となり、平均値の周辺にデータが多く集まっている、つまり「分散」が小さい、ということになります。

ヒストグラムによる正規分布との比較

【Q1】の好意度のデータをヒストグラムにすると下図のようになります。(「挿入」画面の「グラフ」)。ひと目でデータが4.5から6までの高評価に偏っていることがわかります。
この【Q1】の好意度ヒストグラムを、散布図グラフにして正規分布グラフと比較したのが、右側の散布図です。

歪度が-0.579とマイナスなので、正規分布より右側に”山ができ上っている”形となっています。
歪度の絶対数が「1」を超えると正規分布とのズレが問題となりますが、-0.579なので妥当なところでしょう。

【参考】関数による基本統計量の算出

全ての基本統計指標ではなく、ピンポイントで例えば「中央値」だけを見ておきたいというケースがあるかもしれません。そのときには、ローデータの範囲(行・列)を指定し、関数で算出することがいいでしょう。

Excelの「数式」画面で「関数ライブラリ」を参照すれば、各関数のデータ範囲や引数がボックス表示で入力できますので、以下には詳細は記さず、関数の名称のみ記載いたします。
>>『関数ライブラリの使い方』を見る【資料を無料ダウンロード】

相関と回帰分析

相関分析

「相関」とは文字通り、データとデータの関連性を表します。
指標となるのは、0~1の間の「相関係数」で、1に近ければ近いほど相関関係は強く、低ければ弱い、またプラスの場合を「正の相関」と呼び、一方のデータの値が高くなるのと比例してもう一方のデータの値は高くなり、マイナスの場合、逆に低くなります。

回帰分析

回帰分析は、原因となる「説明変数」から、結果となる「被説明変数」を導き出す計算式を算出します(モデル化)。
多くの場合、回帰分析は予測モデルとして使われますが、アンケート調査結果などカテゴリーデータでもモデルを作ることはできます。
以下は、回帰分析のイメージです。1対1が「単回帰分析」、多対1が「重回帰分析」です。

相関係数

「相関係数(そうかんけいすう)」とは、2種類のデータの直線的な関係の強さを表す指標のことです。
データ同士に「相関関係」があっても、原因と結果が明確な「因果関係」とは異なるので注意しましょう、と調査の世界ではよく聞きます。それでも、相関関係のない因果関係もほとんどないと思いますし、データ同士の「関連性」を相関分析で明らかにすることも、データ分析では重要です。

ここでは、「【Q1】好意度」と「【Q2】香味特性」の、全データ間の相関係数を求めてみましょう。Excel「データ」画面から「データ分析」をクリック、ボックスの「相関」を選び「OK」をクリックします。

「相関」のボックスが表示されたら、最初に「入力範囲」を指定します。好意度と香味特性全て、C1列からO列401までの範囲です(絶対参照の「$」は自動的に付けられます)。
「先頭をラベルとして使用(L)」にチェックを入れたら、「OK」をクリックします。

「出力オプション」でデフォルトの「新規ワークシート」のまま「OK」をクリックすると、別シートに「相関行列表」が作成されます。下記の表が「相関行列表」です。

数字の「相関係数」は0から1の間、0に近ければ相関関係は弱く、1に近ければ相関関係は強いことになります。正の値は「正の相関」といいます。負の値は「負の相関」といい、一方の値が上がるとそれに反比例し、もう一方の値は下がります。

この「相関行列表」をみると、好意度との正の相関が最も強い香味特性は「口当たり」、逆に負の相関が最も高いのは「軽さ」ということがわかります。

【参考】相関係数の基準について

相関関係の強弱の統計的基準はありません。対象となるカテゴリーによっても異なり、都度、分析者の判断によるでしょう。以下の目安はあくまでも参考です。
*『Excelで学ぶ統計解析入門』(菅民郎 著、オーム社 2016年)を基に作成

単回帰分析

前述の相関行列表より、つまり「口当たり」の数値が上がれば「好意度」はアップ、「軽さ」の数値が上がれば「好意度」はダウンする、という推測も可能です。もちろん「軽さ」を好むユーザーもいますし、「好意度」と「軽さ」の相関係数の絶対値は0.47と、「口当たり」の0.74より低くなっています。
そこで、散布図を使って「好意度」と「口当たり」、「好意度」と「軽さ」の回帰分析を行ってみましょう。

散布図はExcelで隣り合うセルでしか作成できませんので、ローデータのシート内に「好意度」と「口当たり」「軽さ」の行をコピー&ペーストして散布図の作成元データとします。前者はQ列とR列、後者はT列とU列、ともに401行目までです。

散布図のオプションでは、以下のように選んでください。

散布図が作成されました。

「口当たり」は「好意度」に対し正の相関、「軽さ」は「好意度」に対し負の相関となることがわかります。
ローデータは好意度、香味特性とも「1~7」のカテゴリーデータですので、散布図のプロットの数は少ないものの、回答者は合計400名なので、多くのプロットが重複しているため、少なく見えているわけです。

次に、散布図のグラフエリア内(例えばプロットの上など)にカーソルを置き、右クリックすると、「近似曲線の追加(R)」が表示され、そこをクリックすると、右側に「近似曲線の書式設定」が表示されます。

図の通りに進めると、散布図の右上に数式が入りました(数式はグラフ上に表示されますので、右上に移動し、タイトルを含め、文字の大きさや太さを調整してあります)。これが単回帰式です。

「口当たり」の単回帰式「y=0.8579x+0.5179」で、 0.8579を「回帰係数」、0.5179を「切片」と呼びます。「口当たり」評価が1だった場合、「好意度」は1.4に、7だった場合は「好意度」6.5になるという計算式です。

R二乗」は重決定といい、相関係数の二乗です。0から1の数字で、回帰式の当てはまり具合の指標で、もちろん1に近いほうが当てはまりがいいことになります。
もし「R二乗」を1.0と仮定した場合、理論上、 単回帰式の結果はきれいに1から7になるはずですが、 「R二乗」0.54の場合(上記の回帰式は54%説明できる)、「好意度」は1.4~6.5の範囲となります

この当てはまり具合がどの程度良いのか悪いのか? については、経験に基づいた分析者の主観によります。

「相関係数」と同様、その二乗値である「R二乗」(重決定)にも統計的に明確な基準はありません
後述の「参考:数値データの単回帰分析」で解説いたしますが、数値データの場合、 「R二乗」(重決定)が0.9以上のように極めて高い数値になることは多々あります。しかし、アンケート調査データのケースですと、0.9のような高い数値が出ることは多くありません。

実務でも学術でも、対象となる分野やカテゴリーによって各々独自の特徴があります。よって、 「R二乗」(重決定)を絶対的な基準と考えるだけでなく、あるモデルと別のモデルで、どちらの当てはまり具合が良いかなど、相対的に比較するときの基準としても採用されています。

重回帰分析

Excelで手軽にできるのは「単回帰分析」ですが、単回帰分析を繰り返すことによって「重回帰分析」を行うことも可能です。

「データ」画面で「データ分析」→「回帰分析」と進みます。

「回帰分析」ボックスでは、「入力Y範囲(Y)」は被説明変数(従属変数)ですので「好意度」(C2からC401)、「入力X範囲(X)」は説明変数(独立変数)ですので「香味特性(「香り」から「クセ」まで)」(D2からO401)です。

回帰分析結果が出力されました。

次に「好意度」への影響が相対的に弱い「香味特性」削除の準備をします。

「データ」画面で「データ分析」→「回帰分析」と進みます。

「回帰分析」ボックスでは、「入力Y範囲(Y)」は被説明変数(従属変数)ですので「好意度」(C2からC401)、「入力X範囲(X)」は説明変数(独立変数)ですので「香味特性(「香り」から「クセ」まで)」(D2からK401)です。

回帰分析結果が出力されました。「補正R2」は0.621から0.624とアップしました。

重回帰式は、「切片」に各香味特性の「回帰係数×値」を足し上げていきます。値はカテゴリーデータの「1~7」の範囲内です。

好意度=1.691+0.153×香り-0.05×甘味+0.062×酸味+0.143×飲みごたえ +0.095×後味+0.354×口当たり+0.038×すっきり-0.082×クセ

 回帰分析は主に予測モデルとして使われます。

では、今回の例で、アンケート調査結果のカテゴリーデータで重回帰分析を行うメリットは何でしょうか?それは「香味特性」が「好意度」に与える影響度の測定です。

影響度=回帰係数×データレンジ(範囲)

データレンジはこのカテゴリーデータの場合、全ての「香味特性」が1から7で同一ですので、回帰係数の大きさが「好意度」への影響度ということになります。

つまり、「好意度」に最も影響が強いのは「口当たり」(0.35)で「香り」(0.15)、「飲みごたえ」(0.14)が続き、逆に「クセ」(0.08)と「甘み」(0.05)はマイナスの影響を与える、ということになります。
*参考:『Excelでできるデータマイニング入門』(上田太一郎 著、同友館 2000年)

【参考】数値データの単回帰分析

今まで、相関も回帰分析も、アンケート調査結果の「カテゴリーデータ(選択肢の「1~7」など)」を使って解説してきましたが、相関も回帰分析も、金額や数量などのデータ(正確にいうとメトリックデータの比率尺度)によって解説されることが一般的です。

具体的には、全国の「世帯数」と「新聞発行部数」の関係の回帰分析を、下記よりダウンロードできる資料で詳しい画像付きで解説していますので、合わせてぜひご活用ください。
>>『数値データの単回帰分析』の解説を見る【資料を無料ダウンロード】

まとめと留意点

ここまでの解説で、「SPSS」や「エクセル統計」などの有償の統計ソフトを使わなくても、Excelを利用したデータの集計や分析がここまでできる!ということをご理解いただけたと思います。

最後に2つ留意点があります。

留意点①単純集計表とクロス集計表

データ分析の基礎はローデータです。ローデータの加工において、関数に誤りがあると、手戻りとなり、時間と労力の多大なロスが発生します。
関数入力後、ドラッグやコピー&ペーストをするとき、絶対参照($)が列だけ必要なのか・行だけ必要なのか・両方とも必要かを見極めることも、重要です。

また、単純集計表、クロス集計表ともに、あらかじめ作成したフォームに関数を入力する方法が早く正確ですが、もし時間が許すのなら、ピボットテーブルでも集計し、データに誤りがないかを検証すれば万全です。下記よりダウンロードできる資料内にて、ピボットテーブルでの集計例もご紹介しているので、合わせてぜひご覧ください。
>>『ピボットテーブルによる単純集計・クロス集計のやり方』を見る【資料を無料ダウンロード】

留意点②相関と回帰分析

「多対1」の重回帰分析は、実務・学術の現場では有償の統計ソフトを使うケースがほとんどですが、アンケート調査のカテゴリーデータでも、影響度の測定の用途で使えることを解説いたしました。
「補正R2」の値が最も高くなるまで回帰分析を繰り返すので、時間と手間はかかりますが、こういう分析もできるということを覚えておくことも無駄ではないでしょう。

資料ダウンロード「エクセルでできるアンケートの集計と分析のやり方」

本記事で解説した「エクセルでできるアンケートの集計と分析のやり方」についてまとめた資料は、下記よりダウンロードすることができます(無料)。こちらの資料では、ほとんどのページに画像での解説があり、またサイトには載っていない『ピボットテーブルの使い方』や『単数回答・複数回答のクロス集計表のグラフ化』や『グラフの整形方法』なども掲載しています。
無料ですので、下記よりダウンロードして、活用していただければ幸いです。


おわりに

Excelを使ったアンケートの集計と分析について、必要な知識や具体的なやり方を解説してきました。専門用語が多く一見難しそうに思えますが、身近なビジネスツールであるExcelを利用して行えるということを、ぜひ知っておいてください。ビジネス上、データを多く取り扱う方に、役立つことを願っています。

もっと簡単で、
もっと自由なアンケートを作ろう

「500円」から始められる

セルフ型アンケートツール「Freeasy」

初心者の方には、分かりやすく! 
経験者の方には、高機能でもっと低コスト且つスピーディーに!
500円から始められる自由で簡単なセルフ型アンケートツール「Freeasy」を
さっそく始めてみませんか?

記事ランキング

ページトップへ