考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在一组学校学生信息数据当中,有一列数据是血型,如图所示: (2)为了解决有序编码中存在的问题,我们可以采用one-hot编码方式,one-hot编码中,原来一共有4个不同的血型,那么编码之后一般来说会拆分成几列
A. 1列
B. 2列
C. 3列
D. 4列
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

one-hot编码需要减去一类

正确答案是 D: 4列。

分析:
One-hot编码是一种常用的将分类数据转换为数值数据的编码方式。对于每一个类别,one-hot编码会创建一个新的二进制特征,只有在该类别的情况下该特征值为1,其余情况下为0。具体到血型数据,如果原来有4个不同的血型(例如A型、B型、AB型、O型),那么one-hot编码之后会拆分成4列,每一列对应一个血型。

举个例子,假设有如下血型数据:
- A型
- B型
- AB型
- O型

经过one-hot编码后,数据会变成如下形式:

| 原始血型 | A型 | B型 | AB型 | O型 |
|---------|----|----|-----|----|
| A型 | 1 | 0 | 0 | 0 |
| B型 | 0 | 1 | 0 | 0 |
| AB型 | 0 | 0 | 1 | 0 |
| O型 | 0 | 0 | 0 | 1 |

因此,原来有4个不同的血型,编码之后会拆分成4列。