考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

数据质量校验的方式错误的是
A. 加大内存在shuffle的容量,加快计算
B. 根据数据整体批次比对,查看数据有无遗漏
C. 根据数据的某些进行聚合,查看整体数据有无偏差
D. 抽样明细数据比对完整列能否对齐
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在数据质量校验中,通常会使用多种方法来确保数据的准确性和完整性。让我们逐一分析选项:

A: 加大内存在shuffle的容量,加快计算
这个选项关注的是计算性能的提升,而不是数据质量校验的方法。虽然加大内存和提升计算速度可能间接帮助处理大数据集,但它并不直接涉及数据质量的校验。因此,这不是一个有效的质量校验方法。

B: 根据数据整体批次比对,查看数据有无遗漏
这种方法涉及检查数据批次之间的一致性和完整性,是一种常见的数据质量校验方式。它可以帮助识别数据是否在传输或处理过程中丢失。

C: 根据数据的某些进行聚合,查看整体数据有无偏差
通过聚合数据并检查其偏差,可以识别出数据集中可能存在的异常或错误。这是一种有效的质量校验方法。

D: 抽样明细数据比对完整列能否对齐
通过抽样检查数据的详细信息,并确保它们在预期的列中对齐,是验证数据完整性和结构的一种方法。这也是一种常用的质量校验技术。

综上所述,选项A是错误的,因为它关注的是计算性能而不是直接的质量校验方法。正确答案是A。