数据泛化:把较低层次的概念用较高层次的概念替换来汇总数据。数据泛化就是类似于将广州市,东莞市都转换成广东省,因此D是错误的
正确答案是:A: 数据泛化针对的对象是类别型字段。
专业分析:
数据泛化是一种数据处理技术,它通过将较低层次的概念用较高层次的概念替换来汇总数据,从而减少数据的细节和复杂性。这种技术在数据挖掘和数据分析中非常常见,尤其是在处理大规模数据集时。
以下是对各选项的分析:
A: 数据泛化针对的对象是类别型字段。
- 这个描述是错误的。数据泛化不仅仅针对类别型字段,也可以针对数值型字段。例如,可以将具体的数值数据(如年龄)泛化为区间或类别(如青年、中年、老年)。
B: 用老、中、青分别代替(20-35,36-50,51-70)的年龄区间值。
- 这个描述是正确的。这是一种典型的数据泛化方法,通过将具体的年龄值替换为更高层次的概念(年龄段)来简化数据。
C: 用省代替市是一种数据泛化。
- 这个描述是正确的。将更具体的地理信息(市)替换为更广泛的地理信息(省)是一种数据泛化。
D: 将连续的年龄值变成区间范围是数据泛化。
- 这个描述是正确的。将具体的年龄值转换为区间范围(如20-35岁)是一种数据泛化方式。
综上所述,选项A是错误的,因为数据泛化不仅仅适用于类别型字段,也可以应用于数值型字段。