Python数据分析频数分布统计方法-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

假设有Series对象ss，其属于分类型变量，如果需要统计该变量的频数分布，可以使用以下哪个方法？

A. ss.value_counts()

B. np.unique()

C. np.freq()

D. pd.nunique()

上一题

下一题

题目解析

题目评论(0)

正确答案是：A: `ss.value_counts()`

分析：

- `ss.value_counts()`: 这是Pandas库中Series对象的一个方法，用于统计每个唯一值的频数，即频数分布。对于分类型变量，`value_counts()`是最常用的方法，因为它能直接返回每个类别及其出现的次数，并且可以按频数排序。

- `np.unique()`: 这是NumPy库中的一个函数，用于返回数组中的唯一值。如果设置`return_counts=True`，它可以返回每个唯一值的出现次数。但是，`np.unique()`主要用于NumPy数组，而不是Pandas的Series对象。虽然可以通过将Series转换为NumPy数组来使用，但它不是最直接的方法。

- `np.freq()`: 这个选项在标准的NumPy库中并不存在。可能是一个假设的函数或者在某些特定的上下文中定义的函数，但不是一个通用的方法。

- `pd.nunique()`: 这是Pandas库中用于统计Series或DataFrame中唯一值的数量的方法。它返回的是唯一值的个数，而不是每个值的频数分布。因此，它不适用于获取频数分布。

因此，对于统计分类型变量的频数分布，`ss.value_counts()`是最合适的方法。