数据预处理中类别型特征处理方法-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

在对数据进行预处理时，应该怎样处理类别型特征（）（多选）

A. 序号编码

B. 独热编码

C. 二进制编码

D. 归一化处理

上一题

下一题

题目解析

题目评论(0)

在对数据进行预处理时，类别型特征的处理方法有多种，以下是对各个选项的分析：

A: **序号编码（Label Encoding）**
- **适用场景**：适用于类别之间有序的特征。
- **缺点**：对无序类别使用时可能引入误导性的顺序关系。

B: **独热编码（One-Hot Encoding）**
- **适用场景**：适用于类别之间无序的特征。
- **优点**：避免了序号编码带来的顺序问题。
- **缺点**：会增加数据维度，处理高基数特征时可能导致维度灾难。

C: **二进制编码（Binary Encoding）**
- **适用场景**：面对高基数类别特征时。
- **优点**：减少了独热编码的维度扩展问题。
- **缺点**：编码过程相对复杂。

D: **归一化处理（Normalization）**
- **适用场景**：通常用于数值型特征。
- **缺点**：不适用于类别型特征。

**正确答案**：A, B, C

**分析**：
- 序号编码、独热编码和二进制编码都是处理类别型特征的常用方法，适用于不同的场景和需求。
- 归一化处理通常用于数值型数据，不适合直接应用于类别型特征。