
アンケートの5段階評価とは?使うべきケース・失敗しない設計と活用ポイントを解説
本記事では、アンケートでよく使われる「5段階評価」について、「本当にこの設計で合っているのか?」「なんとなく使っていないか?」と少しでも不安を感じている方に向けて、選ぶべきケース/避けるべきケースから、失敗しない設計の考え方、具体的な質問・選択肢例までを体系的に整理し、解説します。
アンケートにおける5段階評価(リッカート尺度)の概要
アンケートでよく使われる「5段階評価」は、回答の度合いを段階的に選ばせる評価形式で、学術的には「リッカート尺度」と呼ばれます。
本章では、5段階評価の基本的な考え方と、どのような質問・選択肢で使われているのかを整理します。
│よく使われる評価ラベル(テンプレート)
満足度
非常に満足/やや満足/どちらともいえない/やや不満/非常に不満
同意
非常にそう思う/ややそう思う/どちらともいえない/あまりそう思わない/全くそう思わない
当てはまり
とても当てはまる/やや当てはまる/どちらともいえない/あまり当てはまらない/全く当てはまらない
重要度
非常に重要/ やや重要/ どちらともいえない/あまり重要でない /全く重要でない
頻度
いつも/よくある/ときどきある/あまりない/ 全くない
推奨意向
とても勧めたい/ やや勧めたい/どちらともいえない/あまり勧めたくない/全く勧めたくない
(※5段階での推奨意向質問は、厳密なNPS(11段階)とは異なり、他者への推奨行動そのものではなく、サービスに対する好意度の傾向把握に留まります)
│5段階評価が“標準”である理由
心理学的背景
人間の心理的な感覚を言語化する際、3段階では粗すぎてグラデーションが表現できず、7段階以上では細かすぎて選択に迷いが生じます。「心理学で広く使われてきた」背景から、実務においても回答の安定性が高い尺度として扱われてきました。
マーケティング実務的な理由
回答者の負担が重すぎず、かつ「肯定・中立・否定」を明確に分けられるため、用途を選ばず標準として使いやすいのが特徴です。
“ちょうどよさ”のバランス
心理学的な理由でも、マーケティング実務的な理由でも、5段階は“ちょうどいい”ということになります。3段階は粗く、7段階は負荷が高く、5段階は「回答負荷」と「データの解像度」のバランスが最も優れています。
5段階評価の使用判断基準
5段階評価は、幅広い調査で使いやすい一方、調査の目的や知りたい内容によっては、他の尺度の方が適している場合もあります。
ここでは、どのような条件・目的であれば5段階評価が適しているのか、また、どんな場合に別の尺度を検討すべきかという判断基準を整理します。
│5段階評価を選んだ方がいいケース
- 満足度/好意度/当てはまりなど「度合い」を測りたい
- 回答者の負担を抑えたい(離脱を防ぎたい)
- 過去の調査や他社データとの時系列比較・ベンチマークを前提としている
│5段階評価を選ばない方がよいケース
- 理由や背景を深く知りたい(→自由回答・深掘り設計へ)
- 強制的に賛否を分けたい(→4段階の強制選択へ)
- 評価の差を極端に出したい(→7段階へ)
5段階評価のメリット・デメリット・よくある失敗
5段階評価は、回答がしやすく集計もしやすい一方で、使い方を誤ると、期待したデータが得られないこともあります。
ここでは、5段階評価のメリットと注意点を整理したうえで、実務で特に起こりやすい失敗例を確認します。
│メリットは、回答がスムーズ・集計が用意・汎用性が高いこと
- 回答がスムーズ:選択肢の構造がシンプルで、回答者が迷いにくいです。
- 集計が容易:肯定的な2つを足す「Top2Box」などの分析手法が確立されています。
- 汎用性が高い:どんな属性のターゲットにも理解されやすいです。
│デメリットは、中心化傾向になりやすく、強い表現を避けがちなこと
- 中心化傾向:日本人は特に「どちらともいえない」を選びやすい傾向があります。
- 極端な回答の回避:「非常に〜」という強い表現を避ける心理が働くことがあります。
│よくある失敗
- 尺度の非対称とラベル不統一
- 設問と選択肢の不整合
- 中立・不明の混同
※具体的なNG例と改善方法は後述します。
失敗しない5段階評価の作り方
5段階評価の失敗の多くは、集計時ではなく、設問や選択肢を設計する段階で起こります。
ここでは、実務で特に起こりやすいNG例をもとに、なぜ失敗につながるのか、そして、どのように設計すればよいのかを具体的に解説します。
│NG例1:選択肢が対称でない
Q.このサービスの満足度を教えてください 非常に満足/満足/やや満足/不満/非常に不満 |
❌なぜNG?
満足側が多く、否定側が少ないためバイアスがかかる。
「非常に」は心理的に選ばれにくいため、数だけを増やすと分布が歪みやすくなる。
✅対策
両端の強さを揃え、ポジ/ネガを同数にする。
│NG例2:否定形で向きが逆転
Q.このサービスは使いにくくないと思いますか 非常にそう思う/ややそう思う/どちらともいえない/あまりそう思わない/全くそう思わない |
❌なぜNG?
肯定なのか否定なのか直感的に分かりづらく、回答者が「設問の理解」と「自己評価」を同時に行う必要があり、認知負荷が高くなる。
✅対策
肯定文に統一する。どうしても必要なら設問内で強調表示(「ない」を太字にする等)。
│NG例3:二重質問(ダブルバーレル)
Q.この商品は「価格が安く品質が高い」と思いますか 非常にそう思う/ややそう思う/どちらともいえない/あまりそう思わない/全くそう思わない |
❌なぜNG?
価格と品質、どちらで判断するか人によって異なる。
✅対策
質問文×選択肢を1セットで設計し、それぞれ独立した2問として分解する。
│NG例4:「どちらともいえない」に異質な回答が混在
Q.このブランドは信頼できると思いますか 非常にそう思う/ややそう思う/どちらともいえない/あまりそう思わない/全くそう思わない |
❌なぜNG?
「どちらともいえない」に「知らない」「興味がない」「判断できない」も混ざる。
✅対策
明確に判断できない層がいる場合は、5段階とは別に「わからない」「利用したことがない」という選択肢を末尾に配置する。
│NG例5:「わからない」を中立に含めてしまう
Q.このサービスの満足度を教えてください 非常に満足/やや満足/どちらともいえない・わからない/やや不満/非常に不満 |
❌なぜNG?
「どちらともいえない」の問題は、「わからない」を混ぜてしまうことで、中立と非認知が混ざり、分析不能になる。
✅対策
「わからない」を別選択肢として末尾に配置する。
そのまま使える質問例と5段階評価選択肢
5段階評価は、評価の目的に応じて質問文や選択肢の表現を適切に設計することが重要です。
前章で紹介した設計のポイントを踏まえたうえで、ここでは、満足度・同意・当てはまり・重要度・頻度・推奨意向など、5段階評価でよく使われる質問タイプごとに、実務ですぐに使える質問例と選択肢を具体的に紹介します。
│5段階評価でよく使われる質問タイプ
😊満足度を測る質問
Q.このサービスの満足度を教えてください
非常に満足/やや満足/どちらともいえない/やや不満/非常に不満
📊同意(リッカート尺度)を測る質問
Q.この商品はコストパフォーマンスが高いと思いますか
非常にそう思う/ややそう思う/どちらともいえない/あまりそう思わない/全くそう思わない
🏷️当てはまり(ブランドイメージ)を測る質問
Q.このブランドは信頼できますか
非常にそう思う/ややそう思う/どちらともいえない/あまりそう思わない/全くそう思わない
⭐重要度(購買要因)を測る質問
Q.購入時に価格はどの程度重要ですか
非常に重要/やや重要/どちらともいえない/あまり重要でない/全く重要でない
🔁頻度を測る質問
Q.このサービスをどの程度利用しますか
ほぼ毎日/週に数回/月に数回/ほとんど利用しない/全く利用しない
※利用頻度の選択肢は、実際の利用シーンに応じて調整してください。
👍推奨意向を測る質問(5段階)
Q.このサービスを他人に勧めたいと思いますか
とても勧めたい/やや勧めたい/どちらともいえない/あまり勧めたくない/全く勧めたくない
*5段階での推奨意向は、厳密なNPS(11段階)とはスコアの算出方法が異なります。あくまで「好意度の傾向」として把握するのに適しています。
集計・分析を見据えた調査設計のポイント
集計・分析のときに困ることがないよう、調査は、実施前の設計段階から分析を見据えて組み立てることが重要です。
ここでは、5段階評価を使った調査で特に意識したい、設計段階のポイントを3つに分けて解説します。
│平均値だけで判断せず、分布確認・TOP2Boxを算出する
- 分布の確認が必要です。グラフ化して回答の偏りを見ます。
- 「非常に満足」「満足」の合計%( Top2Box )を算出、ポジティブ層の割合をKPI化します。
例えば「平均3.2点」という数値だけでは、全員が「普通」と答えたのか、満足と不満で二極化したのかが分かりません。
分布を見ることで、「どの層を改善すべきか」まで判断できるようになります。
│設計段階でKPIを決める
- 集計後に「何を見ればいいか」を迷わないよう、事前にKPI(例:「満足度Top2Box 60%以上)を設定しておきます。
- KPIに合わせて、ラベル設計(「やや」を含めるか否か)も調整します。
│クロス集計を前提とした設問設計をする
「20代女性の満足度は高いが、40代男性は低い」といった差を見つけるために、性別・年代など、「差が出そうな軸」を想定して属性を取得しておきましょう。
アンケートツールで5段階評価を使う際の注意点
5段階評価では、「選択肢の数」よりも、どの形式・UIで表示されるかによって、回答の質が大きく変わります。
アンケートツールを利用する際は、設計者がExcelや紙の画面上で思い描いた「5段階評価」が、回答者の画面では異なるニュアンスで伝わってしまうことも珍しくありません。特に「セルフ型アンケートツール(DIYリサーチツール)」では、設計から実装までを一貫して行う分、このズレが起きやすくなります。
ここでは、アンケートツール上で5段階評価を正しく機能させるために、事前に押さえておきたい注意点を整理します。
│正しい形式を使用する
同じ5段階評価でも、「ラジオボタン形式」と「マトリクス形式」では回答者の心理的・物理的な負荷が異なります。メリットとデメリットを理解して、使い分けましょう。
ラジオボタン形式(単一回答)
1問ずつ「非常に満足」から「非常に不満」までの選択肢を独立して提示する形式です。
- メリット:回答者が1問ずつ内容を吟味するため、丁寧な回答が得られやすいことです。
- デメリット:設問数が多いと画面が長くなり、離脱率(ドロップアウト)が高まります。
マトリクス形式(表形式)
複数の評価項目を横軸に評価軸(5段階)として並べる形式です。
- メリット:似たような項目をまとめて聞けるため、回答時間を短縮できます。
- デメリット:同じ操作が続くため、内容を十分に読まないまま回答してしまう「順応」が起きやすくなります。具体的には、内容をよく読まずに「すべて真ん中(3)」や、「すべて左端(1)」にチェックを入れる「適当回答」を誘発しやすくなります。
│スマートフォン表示の特性を理解しておく
PCでは問題なく表示されていても、スマートフォン表示の際の挙動には注意が必要です。
ここではセルフアンケートツールFreeasyを一例として、スマートフォンの表示における注意点を説明します。
スマホ表示の「縦変換」マジック
PCでは横に並んでいた5段階の選択肢(マトリクス形式)が、スマホでは画面幅の制約から、選択肢が縦に積み重なって表示されることが一般的です。
視認性の低下
選択肢を縦に並べると、画面をスクロールしないと「1(非常に良い)」から「5(非常に悪い)」までが見渡せない場合があります。
押し間違い
スマホは指で操作するため、選択肢同士の距離(行間)が狭いと、隣のボタンを誤タップする物理的なエラーが増えます。
集計画面を意識した設問・選択肢設計
全設問で「左(上)がポジティブ、右(下)がネガティブ」といったルールを徹底しましょう。設問ごとに「1が最高」「5が最高」と入れ替わると、回答者は混乱し、集計データはノイズだらけになります。
対策
以上から、設計者は必ず自分のスマホでテスト回答を行い、想定どおりに見えているかを確認する必要があります。
│ツールによって「5段階評価」の見え方(UI)が変わる
ツールが変われば、UI(ユーザーインターフェース)の設計思想が変わります。以下は具体例です。
スライドバー型
5つのボタンではなく、バーを左右に動かして評価させるツールでは「直感」を測るのに向きますが、厳密な「3(普通)」を選びにくい傾向があります。
スターレーティング
Amazonのレビューのように「星」で評価させるもの。これは「満足度」などの感情的な評価には向きますが、「頻度(よくある~全くない)」などの論理的な評価には不向きです。
FreeasyのようなシンプルUI
汎用性が高い一方、凝ったデザインができないため、「言葉の定義」を設問文でしっかり補足する必要があります。
対策
Excelで作成した「きれいな表」は、アンケートツール上では「バラバラのボタン」に解体されます。そこで「自分のスマホで実際に回答してみる」というプレテスト(テスト回答)を、設計意図とのズレを防ぐための必須工程として組み込むことはとても重要です。
5段階評価と4段階評価・7段階評価の違い
大まかな選び方の指針は、以下の通りです。
- 迷ったら5段階
- 意見を割りたい場合、4段階
- 精緻に見たい場合、7段階
詳細な特徴・用途・懸念点は下表の通りです。

どれが「正解」かではなく、調査の目的や回答者の負担に応じて選ぶことが重要です。
よくある質問(FAQ)
│Q.「どちらともいえない」は必ず入れた方がいいですか?
必須ではありませんが、基本的には入れることを推奨します。無理に選ばせると、本来「普通」の人が適当に回答し、データの精度が落ちる(ノイズになる)可能性があるためです。
│Q.「わからない」はどこに置くのがいいでしょうか?
尺度とは分離し、末尾に配置します。分析から除外しやすくするためです。
│Q.5段階評価を1〜5点の数値で平均化して分析しても問題ないですか?
実務上は広く行われていますが、本来は「満足」と「不満」の間隔が数学的に等間隔とは限りません。平均値だけでなく「回答の分布(%)」をセットで見ることが重要です。
│Q.7段階の方が5段階よりも精度が高いと言えますか?
必ずしもそうとは言えません。7段階は解像度が高い一方で、回答負荷が高くなる傾向があります。
│Q.スマホ回答者が多い場合、選択肢はどう並べればいいでしょうか?
上から「ポジティブ→ネガティブ」の順に並べるのが一般的です。調査全体でその順序を統一し、回答者が混乱しないようにしてください。
まとめ
最後にこの記事で解説したことをまとめました。振り返りとして参考にしてください。
そもそも、アンケート調査における5段階評価は、リッカート尺度と呼ばれる評価形式のひとつで、回答の度合いを段階的に測るために広く使われています。
心理学的・マーケティング実務的の両面から見ても、5段階評価は、4段階や7段階と比べて「回答負荷」と「データの解像度」のバランスが取りやすく、最も標準的に使われている評価尺度のひとつです。
5段階評価には、回答がスムーズで集計しやすく、汎用性が高いというメリットがある一方で、設計を誤るとデータの精度が落ちてしまう注意点もあります。
5段階評価で特に多い失敗としては、選択肢の非対称や否定形設問、二重質問(ダブルバーレル)、「どちらともいえない」や「わからない」の扱い方などが挙げられます。
そのため、設計段階から集計・分析を見据え、平均値だけに頼らず分布やTop2Boxを確認することや、あらかじめKPIを定めておくことが重要になります。
また、同じ5段階評価であっても、ラジオボタン形式やマトリクス形式など、表示形式(UI)によって回答のされ方が大きく変わる点にも注意が必要です。
加えて、4段階評価や7段階評価といった他の尺度にもそれぞれ特性があり、調査の目的や回答者の負担に応じて、最適な尺度を選ぶことが求められます。
5段階評価は万能ではありませんが、「目的・設計・表示形式・集計方法」まで理解した上で使えば、アンケート結果を意思決定につなげる強力な手段になります。
本記事を参考に、ぜひ一度、自分のアンケート設計を見直してみてください。
\アンケート調査の実施手段を検討中の方へ/
5段階評価を使ったアンケート調査は、設計だけでなく「実装のしかた」によっても、回答の質やデータの精度が大きく変わります。
セルフ型アンケートツール「Freeasy」では、Webアンケートの実施について、ツールの機能・料金・活用シーン・導入事例などをまとめたサービス紹介資料をご用意しています。
5段階評価を含むアンケート調査の設計や運用を考える際に、ツールを活用する選択肢として参考にしていただけます。





