考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在特征工程里,特征编码是占比很重的一块。在特征编码时,会将一列特征变成多列的方法是:
A. one-hot编码(独热编码)
B. 映射有序特征
C. 特征二值化
D. 特征离散化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

one-hot编码会将一列变成多列

正确答案是:A: one-hot编码(独热编码)。

专业分析:
特征工程是机器学习中非常重要的一步,特征编码则是特征工程中的一个关键部分。特征编码的目的是将原始数据转换为适合模型处理的格式。

1. **one-hot编码(独热编码)**:
- 这是将分类特征(如颜色、种类等)转换为二进制向量的一种方法。每个类别都会变成一个新的二进制特征列,每个样本在属于该类别的位置上为1,其余位置为0。例如,假设有一个颜色特征,包含"红色"、"绿色"、"蓝色"三种类别,通过one-hot编码后,会变成三个特征列:[1, 0, 0](红色),[0, 1, 0](绿色),[0, 0, 1](蓝色)。
- 这种方法的优点是不会引入类别之间的顺序关系,适用于无序的分类特征。

2. **映射有序特征**:
- 这是将有序的分类特征映射为数值的一种方法。适用于有自然顺序的特征,例如"低"、"中"、"高"可以映射为1、2、3。

3. **特征二值化**:
- 这是将数值特征转换为0和1的二值特征的方法,通常用于将连续数值特征转换为二进制特征。例如,将某个特征值大于某个阈值的部分设为1,小于或等于阈值的部分设为0。

4. **特征离散化**:
- 这是将连续数值特征转换为离散类别的方法。例如,将年龄分为“青年”、“中年”、“老年”三个类别。

综上所述,将一列特征变成多列的方法是one-hot编码(独热编码),因此正确答案是A。