考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

以下何者是数据编码中(Data Coding)常用的技术(多选)
A. 数值型属性离散化
B. 类别型属性一般化
C. 数值型属性正规化
D. 数值型属性扩充化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在数据编码中,常用的技术主要包括数值型属性离散化、类别型属性一般化和数值型属性正规化。这些技术各自用于不同的场景和目的。以下是对这些选项的分析:

1. **A: 数值型属性离散化**
- **正确**。这是将连续数值数据转换为离散类别的过程。常用于减小模型复杂度或处理非线性关系。常见的方法包括等宽离散化、等频离散化和聚类方法(如K-means)。

2. **B: 类别型属性一般化**
- **正确**。类别型属性一般化是将具体的类别值转换为更泛化的类别,比如将“苹果”与“香蕉”均归为“水果”。这在数据隐私保护和数据压缩中很有用。

3. **C: 数值型属性正规化**
- **正确**。数值型属性正规化是将数值数据缩放到一个特定范围,如[0, 1]或[-1, 1]。正规化有助于提升模型训练的速度和精度,尤其是在涉及梯度下降优化的模型中常用。

4. **D: 数值型属性扩充化**
- **不常见**。这个选项不属于标准的数据编码技术。通常在提到“扩充”时,指的是数据增强的概念,例如在图像处理中进行图像旋转或翻转等。而在数值型数据处理中,扩充化不是常用的术语。

因此,正确答案是 **A、B、C**。这些技术在数据预处理中发挥着重要作用,有助于提高模型的性能和效率。