考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

数据泛化把较低层次的概念用较高层次的概念替换来汇总数据。以下对于数据泛化描述错误的是:
A. 数据泛化针对的对象是类别型字段
B. 用老、中、青分别代替(20-35,36-50,51-70)的年龄区间值
C. 用省代替市是一种数据泛化
D. 将连续的年龄值变成区间范围是数据泛化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

数据泛化:把较低层次的概念用较高层次的概念替换来汇总数据。数据泛化就是类似于将广州市,东莞市都转换成广东省,因此D是错误的

正确答案是:A: 数据泛化针对的对象是类别型字段。

专业分析:

数据泛化是一种数据处理技术,它通过将较低层次的概念用较高层次的概念替换来汇总数据,从而减少数据的细节和复杂性。这种技术在数据挖掘和数据分析中非常常见,尤其是在处理大规模数据集时。

以下是对各选项的分析:

A: 数据泛化针对的对象是类别型字段。
- 这个描述是错误的。数据泛化不仅仅针对类别型字段,也可以针对数值型字段。例如,可以将具体的数值数据(如年龄)泛化为区间或类别(如青年、中年、老年)。

B: 用老、中、青分别代替(20-35,36-50,51-70)的年龄区间值。
- 这个描述是正确的。这是一种典型的数据泛化方法,通过将具体的年龄值替换为更高层次的概念(年龄段)来简化数据。

C: 用省代替市是一种数据泛化。
- 这个描述是正确的。将更具体的地理信息(市)替换为更广泛的地理信息(省)是一种数据泛化。

D: 将连续的年龄值变成区间范围是数据泛化。
- 这个描述是正确的。将具体的年龄值转换为区间范围(如20-35岁)是一种数据泛化方式。

综上所述,选项A是错误的,因为数据泛化不仅仅适用于类别型字段,也可以应用于数值型字段。