考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在调查问题中,调查员需要收集用户“是否购买过指定产品”的数据。如果从方便数据处理的角度出发,下列方法最适宜的是(   )。
A. 需要编码为数值变量
B. 需要编码为字符变量
C. 需要编码为分类变量
D. 需要编码为二分变量
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

“是否购买过指定产品”的取值为字符型,且只有两种取值:“是”,“否”,为方便后续处理,将其编码为二分变量比较适合

正确答案是:D: 需要编码为二分变量。

专业分析:
在调查中收集用户“是否购买过指定产品”的数据时,通常这个问题的答案只有两个可能的选项:是或者否。因此,这种数据是一种典型的二分变量(binary variable),也称为二分类变量(dichotomous variable)。

编码为二分变量的主要优点包括:

1. **简洁性**:二分变量只有两个值(例如,可以用0表示“否”,1表示“是”),这使得数据在存储和处理时更加简洁和高效。
2. **数据分析的便利性**:许多统计分析方法和机器学习算法都能直接处理二分变量,例如逻辑回归、朴素贝叶斯分类器等。
3. **易于解释**:二分变量的编码方式非常直观,容易理解和解释。

虽然数值变量、字符变量和分类变量也可以用于表示这种数据,但它们在处理二分类问题时可能没有二分变量那么高效和直观。因此,从方便数据处理的角度出发,选择编码为二分变量是最适宜的。