考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

关于python中的缺失值,以下说法正确的是?(多选)
A. Numpy中的缺失值对象np.nan是浮点型数据
B. 某些人为标记为空字符串来表示缺失值的,需要用pandas的replace方法来将空字符串替换成np.nan
C. 选择缺失值填补方法时,需要考虑缺失值所处字段的分布特征
D. 机器学习模型都能自动处理缺失值
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

关于Python中的缺失值,以下说法正确的是:

A: Numpy中的缺失值对象np.nan是浮点型数据
**正确。** `np.nan` 是一个特殊的浮点数,用于表示缺失值或“不是一个数字”的情况。由于其类型是浮点型,在处理数据时要注意类型转换的问题。

B: 某些人为标记为空字符串来表示缺失值的,需要用pandas的replace方法来将空字符串替换成np.nan
**正确。** 在数据清洗过程中,缺失值可能被表示为空字符串、特定字符或其他标记。使用 `pandas` 的 `replace` 方法可以将这些标记替换为 `np.nan`,以便统一处理缺失值。

C: 选择缺失值填补方法时,需要考虑缺失值所处字段的分布特征
**正确。** 在填补缺失值时,选择合适的方法(如均值、中位数、众数填补或插值法)需要考虑数据的分布特征、缺失值的数量和位置以及对分析结果的潜在影响。

D: 机器学习模型都能自动处理缺失值
**错误。** 并不是所有机器学习模型都能自动处理缺失值。某些模型(如决策树和一些基于树的模型)可能对缺失值有一定的鲁棒性,但大多数模型(如线性回归、支持向量机、神经网络等)需要在训练前对缺失值进行处理(如删除或填补)。

综上所述,正确的选项是 A、B、C。