交叉数据是指如果两个表中的数据需要频繁连接,可以使用连接标准将数据物理交叉到相同的物理存储结构。交叉数据可以看作是一种特殊形式的集群,不属于“脏数据”,因此本题选C
                    正确答案是:C: 交叉数据。
专业分析:
在数据处理中,“脏数据”通常是指那些不符合预期格式或存在质量问题的数据,这些数据在分析和使用前需要进行清洗和处理。以下是对各选项的具体分析:
A: 重复数据 - 这是指数据集中存在重复的记录或条目,重复数据会影响数据的准确性和分析结果,因此需要进行清理。
B: 错误数据 - 这是指数据中存在错误的值或信息,比如输入错误、测量错误等。这类数据需要被识别和纠正。
C: 交叉数据 - 这个术语在数据清洗的上下文中并不常见,通常不被认为是“脏数据”。“交叉数据”可能指的是数据集之间的交叉引用或关联,这本身并不代表数据质量问题。
D: 缺失数据 - 这是指数据集中存在缺失的值或记录,缺失数据会影响分析的完整性和准确性,因此需要处理。
综上所述,C: 交叉数据 不属于“脏数据”。