数据编码技术常用方法有哪些-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

以下何者是数据编码中(Data Coding)常用的技术（多选）

A. 数值型属性离散化

B. 类别型属性一般化

C. 数值型属性正规化

D. 数值型属性扩充化

上一题

下一题

题目解析

题目评论(0)

在数据编码中，常用的技术主要包括数值型属性离散化、类别型属性一般化和数值型属性正规化。这些技术各自用于不同的场景和目的。以下是对这些选项的分析：

1. **A: 数值型属性离散化**
- **正确**。这是将连续数值数据转换为离散类别的过程。常用于减小模型复杂度或处理非线性关系。常见的方法包括等宽离散化、等频离散化和聚类方法（如K-means）。

2. **B: 类别型属性一般化**
- **正确**。类别型属性一般化是将具体的类别值转换为更泛化的类别，比如将“苹果”与“香蕉”均归为“水果”。这在数据隐私保护和数据压缩中很有用。

3. **C: 数值型属性正规化**
- **正确**。数值型属性正规化是将数值数据缩放到一个特定范围，如[0, 1]或[-1, 1]。正规化有助于提升模型训练的速度和精度，尤其是在涉及梯度下降优化的模型中常用。

4. **D: 数值型属性扩充化**
- **不常见**。这个选项不属于标准的数据编码技术。通常在提到“扩充”时，指的是数据增强的概念，例如在图像处理中进行图像旋转或翻转等。而在数值型数据处理中，扩充化不是常用的术语。

因此，正确答案是 **A、B、C**。这些技术在数据预处理中发挥着重要作用，有助于提高模型的性能和效率。