考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在特征工程里,特征编码是占比很重的一块。在特征编码时,会将一列特征变成多列的方法是:
A. one-hot编码(独热编码)
B. 映射有序特征
C. 特征二值化
D. 特征离散化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

one-hot编码会将一列变成多列

正确答案是:A: one-hot编码(独热编码)。

**专业分析:**

特征工程是机器学习中非常重要的一部分,特征编码是其中的关键步骤之一。特征编码的目的是将原始数据中的特征转换为适合模型处理的数值格式。

1. **one-hot编码(独热编码)**:
- **定义**:one-hot编码是一种将分类变量(Categorical Variable)转换为二进制向量的方法。每个类别用一个独立的二进制位表示,只有该类别对应的位置为1,其余位置为0。
- **优点**:避免了类别之间的大小关系假设,使得模型能够更好地处理分类变量。
- **应用**:适用于没有内在顺序的分类变量(Nominal Variables)。
- **示例**:如果有一个特征“颜色”有三个类别:红色、绿色、蓝色,使用one-hot编码后会变成三列,每列分别表示一种颜色:
```
红色 绿色 蓝色
1 0 0
0 1 0
0 0 1
```

2. **映射有序特征**:
- **定义**:将有序的分类变量(Ordinal Variable)映射为数值。例如,将“低、中、高”映射为1, 2, 3。
- **适用场景**:适用于有内在顺序的分类变量。

3. **特征二值化**:
- **定义**:将数值特征转化为0和1的二值形式,通常通过设定一个阈值来实现。
- **适用场景**:适用于需要将连续数值特征转化为二值特征的情况。

4. **特征离散化**:
- **定义**:将连续数值特征分割成多个离散的区间,并将每个区间映射为一个离散值。
- **适用场景**:适用于需要将连续特征转化为离散特征的情况。

综上所述,只有one-hot编码(独热编码)是将一列特征变成多列的编码方法,因此正确答案是A。