考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

数据在真正被使用前需进行必要的清洗,使脏数据变为可用数据。下列不属于“脏数据”的是()
A. 重复数据
B. 错误数据
C. 交叉数据
D. 缺失数据
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

交叉数据是指如果两个表中的数据需要频繁连接,可以使用连接标准将数据物理交叉到相同的物理存储结构。交叉数据可以看作是一种特殊形式的集群,不属于“脏数据”,因此本题选C

正确答案是:C: 交叉数据。

专业分析:

在数据处理中,“脏数据”通常是指那些不符合预期格式或存在质量问题的数据,这些数据在分析和使用前需要进行清洗和处理。以下是对各选项的具体分析:

A: 重复数据 - 这是指数据集中存在重复的记录或条目,重复数据会影响数据的准确性和分析结果,因此需要进行清理。

B: 错误数据 - 这是指数据中存在错误的值或信息,比如输入错误、测量错误等。这类数据需要被识别和纠正。

C: 交叉数据 - 这个术语在数据清洗的上下文中并不常见,通常不被认为是“脏数据”。“交叉数据”可能指的是数据集之间的交叉引用或关联,这本身并不代表数据质量问题。

D: 缺失数据 - 这是指数据集中存在缺失的值或记录,缺失数据会影响分析的完整性和准确性,因此需要处理。

综上所述,C: 交叉数据 不属于“脏数据”。