one-hot编码会将一列变成多列
正确答案是:A: one-hot编码(独热编码)。
**专业分析:**
特征工程是机器学习中非常重要的一部分,特征编码是其中的关键步骤之一。特征编码的目的是将原始数据中的特征转换为适合模型处理的数值格式。
1. **one-hot编码(独热编码)**:
- **定义**:one-hot编码是一种将分类变量(Categorical Variable)转换为二进制向量的方法。每个类别用一个独立的二进制位表示,只有该类别对应的位置为1,其余位置为0。
- **优点**:避免了类别之间的大小关系假设,使得模型能够更好地处理分类变量。
- **应用**:适用于没有内在顺序的分类变量(Nominal Variables)。
- **示例**:如果有一个特征“颜色”有三个类别:红色、绿色、蓝色,使用one-hot编码后会变成三列,每列分别表示一种颜色:
```
红色 绿色 蓝色
1 0 0
0 1 0
0 0 1
```
2. **映射有序特征**:
- **定义**:将有序的分类变量(Ordinal Variable)映射为数值。例如,将“低、中、高”映射为1, 2, 3。
- **适用场景**:适用于有内在顺序的分类变量。
3. **特征二值化**:
- **定义**:将数值特征转化为0和1的二值形式,通常通过设定一个阈值来实现。
- **适用场景**:适用于需要将连续数值特征转化为二值特征的情况。
4. **特征离散化**:
- **定义**:将连续数值特征分割成多个离散的区间,并将每个区间映射为一个离散值。
- **适用场景**:适用于需要将连续特征转化为离散特征的情况。
综上所述,只有one-hot编码(独热编码)是将一列特征变成多列的编码方法,因此正确答案是A。