考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设有Series对象ss,其属于分类型变量,如果需要统计该变量的频数分布,可以使用以下哪个方法?
A. ss.value_counts()
B. np.unique()
C. np.freq()
D. pd.nunique()
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:A: `ss.value_counts()`

分析:

- `ss.value_counts()`: 这是Pandas库中Series对象的一个方法,用于统计每个唯一值的频数,即频数分布。对于分类型变量,`value_counts()`是最常用的方法,因为它能直接返回每个类别及其出现的次数,并且可以按频数排序。

- `np.unique()`: 这是NumPy库中的一个函数,用于返回数组中的唯一值。如果设置`return_counts=True`,它可以返回每个唯一值的出现次数。但是,`np.unique()`主要用于NumPy数组,而不是Pandas的Series对象。虽然可以通过将Series转换为NumPy数组来使用,但它不是最直接的方法。

- `np.freq()`: 这个选项在标准的NumPy库中并不存在。可能是一个假设的函数或者在某些特定的上下文中定义的函数,但不是一个通用的方法。

- `pd.nunique()`: 这是Pandas库中用于统计Series或DataFrame中唯一值的数量的方法。它返回的是唯一值的个数,而不是每个值的频数分布。因此,它不适用于获取频数分布。

因此,对于统计分类型变量的频数分布,`ss.value_counts()`是最合适的方法。