考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在调查问题中,调查员需要收集用户“是否购买过指定产品”的数据。如果从方便数据处理的角度出发,下列方法最适宜的是(   )。
A. 需要编码为数值变量
B. 需要编码为字符变量
C. 需要编码为分类变量
D. 需要编码为二分变量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

“是否购买过指定产品”的取值为字符型,且只有两种取值:“是”,“否”,为方便后续处理,将其编码为二分变量比较适合

正确答案是:D: 需要编码为二分变量

专业分析:
在调查问题中,收集用户“是否购买过指定产品”的数据时,最适宜的方法是将其编码为二分变量。二分变量(Binary Variable)是指只有两个可能取值的变量,通常用0和1来表示。例如,可以用0表示“未购买过”,用1表示“购买过”。这种编码方式简单明了,便于数据处理和分析,尤其适合用于统计分析和机器学习模型中。

具体分析如下:
1. **编码为数值变量**:数值变量通常用于表示连续的数值范围(如年龄、收入等),不适合表示“是否”这种二元状态。

2. **编码为字符变量**:字符变量虽然可以表示“是”或“否”,但在数据处理和分析时不如数值变量方便,特别是在进行统计分析或机器学习时,需要额外的处理步骤将字符转换为数值。

3. **编码为分类变量**:分类变量可以用来表示多个类别,但在“是否购买过”这种二元状态下,使用分类变量显得过于复杂,不如二分变量直观和高效。

4. **编码为二分变量**:二分变量直接用0和1表示两种状态,既简洁又便于后续的数据处理和分析,是最适宜的方法。

因此,从方便数据处理的角度出发,将“是否购买过指定产品”编码为二分变量是最合适的选择。