考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在对数据进行预处理时,应该怎样处理类别型特征()(多选)
A. 序号编码
B. 独热编码
C. 二进制编码
D. 归一化处理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在对数据进行预处理时,类别型特征的处理方法有多种,以下是对各个选项的分析:

A: **序号编码(Label Encoding)**
- **适用场景**:适用于类别之间有序的特征。
- **缺点**:对无序类别使用时可能引入误导性的顺序关系。

B: **独热编码(One-Hot Encoding)**
- **适用场景**:适用于类别之间无序的特征。
- **优点**:避免了序号编码带来的顺序问题。
- **缺点**:会增加数据维度,处理高基数特征时可能导致维度灾难。

C: **二进制编码(Binary Encoding)**
- **适用场景**:面对高基数类别特征时。
- **优点**:减少了独热编码的维度扩展问题。
- **缺点**:编码过程相对复杂。

D: **归一化处理(Normalization)**
- **适用场景**:通常用于数值型特征。
- **缺点**:不适用于类别型特征。

**正确答案**:A, B, C

**分析**:
- 序号编码、独热编码和二进制编码都是处理类别型特征的常用方法,适用于不同的场景和需求。
- 归一化处理通常用于数值型数据,不适合直接应用于类别型特征。