答案是D: 4列。
专业分析如下:
One-hot编码是一种将类别变量转换为二进制向量的方法。在这种编码方式中,每个类别都被表示为一个独热向量(one-hot vector),其中只有一个位置上的值为1,其余位置上的值为0。
假设我们有一个包含4种不同血型(A型、B型、AB型、O型)的数据列。使用one-hot编码后,这些血型会被转换成如下形式:
- A型: [1, 0, 0, 0]
- B型: [0, 1, 0, 0]
- AB型: [0, 0, 1, 0]
- O型: [0, 0, 0, 1]
可以看到,原来的一个数据列被拆分成了4列,每一列对应一个血型类别。因此,one-hot编码后会有4列数据。