データクリーニングとは|リサーチ マーケティング用語集
データクリーニング
データクリーニングとは、アンケート調査後に、調査回答データの中に、回答の誤りや矛盾、正確さが疑わしいものなど、不適切な回答がないかを点検し、集計から除外したり、正しく修正したりする作業のことです。データクレンジングや、エディティングとも言います。
例えば下記のような点を修正します。
・誤字
・重複
・数字や空白の全角と半角
・表記のゆらぎ
英語表記は、 data cleaning。
データクリーニングの目的
データクリーニングをおこなうことで、精度の高い、高品質なデータを得ることができます。
また、データをそのまま分析に使用すると、不備を発見するたびにその確認作業や修正等が発生し、分析作業が進まず、非効率的です。
以上の理由から、データクリーニングが完了してからはじめて、分析作業に取り掛かりましょう。
データクリーニングのやり方
対象となるデータベースが多くない場合は、無料で利用できるExcelを使ってデータクリーニングをおこなうことが可能です。
しかしデータベースが多い場合や、社内でデータクリーニング作業への人員を充てることができない場合は、データクレンジングツールや統計分析専用のソフトを活用するのがおすすめです。
コストや補完可能な情報を比較して、自社に最適なものを選びましょう。
関連用語:ローデータ