ウエイトバック集計のやり方、活用法を分かりやすく解説!
目次[非表示]
はじめに
アンケート調査の集計作業で使われる「ウエイトバック集計」。ウエイトは英語の「weight」=「重さ」を由来としています。
ここでは、基礎編と応用編に分けて、具体例を挙げながら、誰もがすぐにアンケート調査結果に反映できるウエイトバック集計のやり方を、分かりやすく解説していきます。
この記事で分かること・できること
●ウエイトバック集計の意味を理解し、アンケート調査結果に反映できるようになる。
●ウエイトバックをかけるべきか否かの判断ができるようになる。
●ウエイトバック集計における「よくある質問」が確認できる。
●ウエイトバック集計に関する、より詳しい説明や図解が掲載された資料が、無料でダウンロードできる。
この記事はこんな方におすすめ
●ウエイトバック集計を使いこなせるようになりたい方。
●集計を専門に行う職種ではないが、ネットリサーチやアンケート集計をする必要性がある方。
ウエイトバック集計とは
ウエイトバック集計とは、アンケート調査の回収データを、母集団の構成の通りに集計することです。ウエイト(weight)は「重さ」という意味で、ウエイトバック集計は「重みづけ」とも呼ばれています。
ウエイトバック集計によって、アンケート回収データは母集団と同じ男女比で集計されます。
集計の手順は、次項の「ウエイトバック集計(基礎編)」で解説しますが、男性と女性各々の集計結果は変わらないまま、全体(男女計)の数字が変わることになります。
ウエイトバック集計のメリットとデメリット
メリット
ウエイトバック集計を行うことで、アンケート回収データが調査対象の母集団(全体)の構成を反映したデータになることです。
後述の「ウェイトバック集計(基礎編)」の例で解説しますが、男女が同数なのに女性からの回答のほうが多い場合、女性の意見が強くなるのではないか?という疑問の声が出ることが少なくありません。
しかしウエイトバック集計を行えば、実際の男女構成を反映したデータとなります。
デメリット
挙げるとするなら、計算に手間がかかることでしょう。
計算方法は複雑ではないので間違うことは少ないと思いますが、Excelを使う場合、セルに入力された計算式に誤りがないよう、入念にチェックをする必要があります。
ウエイトバック集計(基礎編)
ここでは「基礎編」として、最もシンプルなアンケートデータ男女比のウエイトバック集計についてみていきましょう。
ウエイト値の求め方
前述の「ウエイトバック集計のイメージ」をもう一度ご覧ください。
A大学B学部の学生数(母集団)は1,000人で、男性500人、女性500人です。
1,000人の学生にアンケート調査を依頼したところ、全体の回収率は80%で800人。うち男性370人、女性430人。
母集団の男女比は『50%:50%』ですが、回収データでは『46%:54%』です。
そこで母集団の男女比としての結果を算出する、つまり、男性は370人が400人の場合、女性は430人が400人の場合のデータを集計します。具体的には、男女各々のデータにウエイトを掛けます。
ウエイト値=母集団と同じ構成比の人数÷回収データの人数
ウエイト値の求め方(計算方法)は、「ウエイト値=母集団と同じ構成比の人数÷回収データの人数」なので、この場合、男性は『400÷370=1.081』、女性は『400÷430=0.930』になります。
クロス集計表(実数)での集計方法
「回収データ」の男女の値に、ウエイト値を掛けた結果が、「ウエイトバック集計データ」です。
先ほどと同じアンケートを、クロス集計表にすると、次のような表となります。
回収データのイメージ
男性370人、女性430人の回収データを、母集団と同じく、男性400人、女性400人とした場合のデータになるよう集計します。
ウエイトバック集計データのイメージ
具体的には、回収データの赤線内の男性と女性のデータにウエイト値を掛けます。
「ウエイト値=母集団と同じ構成比の人数÷回収データの人数」なので、先述と同じで、男性の場合は『400÷370=1.081』、女性の場合は『400÷430=0.930』になります。
ウエイト値(男性) |
1.081 |
ウエイト値(女性) |
0.930 |
ウエイト値を各セルごとに計算すると、ウエイトバック集計データが完成します。
男女の人数を足し合わせると、「満足している」は612人で回収データと変わりませんが、「どちらともいえない」は109人から111人に増し、「満足していない」は79人から77人に減りました。
クロス集計表(構成比)での確認
回収データとウエイトバック集計データを、クロス集計表の「構成比」で見てみましょう。回収データは次の通りです。
ウエイトバック集計データは次の通りです。
2つのデータを見比べると、ウエイト値を掛けることで「どちらともいえない」は13.6%から13.9%と0.3ポイント増、「満足していない」は9.9%から9.7%と0.2ポイント減となりました。
実務上、どの程度の差までが重視されるのかは、ケースバイケースです。
ウエイトバック集計前後の比較
最後に、ウエイトバック“あり”と“なし”のデータを比較してみましょう。
「満足している」(76.5%)は同ポイントですが、「どちらともいえない」は、ウエイトバック“あり”のほうが0.3ポイント増、「満足していない」は0.2ポイント減となりました。
ウエイトバック集計(応用編)
次に「応用編」として、一般的に行われている人口動態に合わせたウエイトバック集計についてみていきましょう。
人口動態データの活用
「基礎編」と同様、満足度調査を例に挙げます。調査対象エリアは1都3県(東京都、千葉県、埼玉県、神奈川県)、調査対象者は20代以上です。
手順を簡単に説明すると、各年代の人口データは、国勢調査などの政府統計から1都3県合計数を取得→ウエイト値を算出→アンケートの回収データにウエイト値を掛け合わせる(ウエイトバック集計)、という流れになります。
人口動態データを活用したウエイト値の求め方
「1都3県 年代別人口データ」と「アンケート回収データ」の、それぞれの構成比を算出します。
「1都3県 年代別人口データ」の構成比を、「アンケート回収データ構成比」で割った数字が、年代別ウエイト値となります。
クロス集計表(実数)での集計方法
続いて「各年代別の回収データ」にウエイト値を掛けて、ウエイトバック集計をやってみましょう。
回収データのイメージ
ウエイトバック集計データのイメージ
具体的には、「回収データ」の赤線内の年代別データにウエイト値を掛けます。
20代のウエイト値 |
0.9887 |
30代のウエイト値 |
1.0167 |
40代のウエイト値 |
0.9857 |
50代のウエイト値 |
0.8957 |
60代のウエイト値 |
0.6089 |
70代以上のウエイト値 |
1.7787 |
集計した結果、「各年代別の回収データ」と「ウエイトバック集計データ」の回答者数の合計2,929人はそのまま変わりませんが、各年代の人数が変わります。これが人口構成比を反映した人数となります。そして、各年代を足した全体の人数も変わります。
クロス集計表(構成比)での確認
ウエイトバック集計を行ったことで、全体の満足度の人数が変わりました。では、構成比でみてみましょう。
ウエイトバック集計により、「満足している」は2.0ポイント増、「どちらともいえない」は3.6ポイント減、「満足していない」は1.7ポイント増となりました。
ウエイトバック集計前後の比較
基礎編と同様、ウエイトバック“あり”と“なし”のデータを最後に比較してみると、ウエイトバック“あり”のほうが「満足している」は2.0ポイント増、「どちらともいえない」は3.6ポイント減、「満足していない」は1.7ポイント増となりました。
「ウエイトバック集計」にまつわる、よくある質問
Q:ウエイトバック集計が最もよく行われるケースは何ですか。
応用編では1都3県を対象地域とした調査例を取り上げましたが、全国47都道府県を対象地域とした場合、最もウエイトバック集計が活用されます。
人口の多い大都市と少ない地方都市が広く分布している中、人口分布そのままの構成でデータが回収されることはまずありません。
なお、ウエイト値の算出のために最もよく利用されているのが、応用編で取り上げた「国勢調査」をはじめとした「政府の統計データ」です。無料で利用することができますので、活用しましょう。(https://www.e-stat.go.jp/)。
Q:ウエイトバック集計は必ずおこなうべきでしょうか。
母集団の正確な数がわからなければ、ウエイトバック集計を行うことはできません。
そしてウエイトバック集計を行わなくても、母集団から無作為抽出できていれば、統計的にはデータの信頼性があるといわれているので、問題はありません。
ウエイトバック集計の前後で著しい差が出るケースはそう多くはありません。
基礎編では微差、応用編でも1~3ポイントの範囲内の差でした。
どの程度の差が許容できるのか?を調査設計時に決めておければ理想的です。
データ回収後のウエイトバック集計ではなく、アンケートの回収サンプルサイズを人口動態比率に合わせるという「サンプル割付」もよく利用されています。
「サンプル割付」では、47都道府県ごとの目標サンプルサイズに達する難易度が高い、というデメリットはありますが、回収データの集計という手間が省けるというメリットは魅力でしょう。
Q:ウエイトバック集計を行わなくても、回収データの数を揃えることができればいいのでしょうか。
基礎編の例で考えると、男女比が同じなので、「女性の回収数430サンプル」を「男性の370サンプル」に合わせるため、女性から無作為に60サンプル削除して集計をする、ということでしょうが、それは薦められません。
なによりもコストをかけて回収したデータが無駄になりますし、無作為とはいえサンプルを削除することでデータの偏りが生じてしまうからです。
異常値や不正回答を排除するための場合を除き、サンプルの削除は決して行うべきではありません。
無料ダウンロード『ウエイトバック集計マニュアル』
本記事で解説した『ウエイトバック集計』についてまとめた資料は、下記よりダウンロードすることができます(無料)。
おわりに
ここまでウエイトバック集計について詳しく解説してきました。この記事により、アンケート調査の回収データの特性を理解し、正しい重みづけ=ウエイトを掛けた集計方法を理解して、実践に活かしていただけたら幸いです。