本题考查对于脏数据的理解。脏数据是因数据重复录入、共同处理等不规范操作而产生的混乱、无效数据。这些数据不能为企业带来价值,反而会占据存储空间,浪费企业的资源。因此重复数据、错误数据和缺失数据都属于脏数据的范畴,交叉数据是交叉验证过程中使用的。因此本题选C。
正确答案是:C: 交叉数据
专业分析:
“脏数据”是指数据中存在的错误、不准确或不完整的信息,可能会影响数据分析和决策的准确性。具体来看:
A: 重复数据——是指数据集中存在重复的记录,会导致数据冗余和分析结果的不准确。
B: 错误数据——是指数据中存在的错误信息,如输入错误、拼写错误等,会直接影响数据的准确性。
C: 交叉数据——这个选项不属于常见的“脏数据”类型。交叉数据通常是指在不同的数据集之间存在的关联或交叉引用,通常在数据分析中是有用的信息。
D: 缺失数据——是指数据集中存在缺失的数值或信息,会导致数据不完整,影响分析结果。
因此,C: 交叉数据不属于“脏数据”的范畴。