本條目存在以下問題,請協助 改善本條目或在 討論頁針對議題發表看法。
此條目需要 精通或熟悉相关主题的编者参与及协助编辑。 (2013年2月27日) 請邀請適合的人士改善本条目。更多的細節與詳情請參见討論頁。 |
|
从广义上看,脏数据是指没有进行过数据预处理而直接接收到的、处于原始状态的数据;从狭义上看,是不符合研究要求,以及不能够对其直接进行相应的数据分析。
脏数据依据不同的分析目的有不同的定义,如在常见的数据挖掘工作中,脏数据是指不完整、含噪声、不一致的数据;而在问卷分析中,脏数据则是指不符合问卷要求的数据。