数据分析师考试：如何计算非重复国家数量-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

以下哪些方法可以返回数据中非重复国家名的数量？（多选）

A. len( drinks.country.value_counts() )

B. drinks.country.nunique()

C. len( drinks.country.unique() )

D. len( drinks.country )

上一题

下一题

题目解析

题目评论(0)

在 Pandas 数据分析中，当我们想要计算数据中非重复国家名的数量时，可以使用以下方法：

1. **A: `len(drinks.country.value_counts())`**
- `value_counts()` 方法将返回一个包含唯一值的频率计数的 Series。`len()` 函数计算这个 Series 的长度，即唯一国家名的数量。
- **正确**。

2. **B: `drinks.country.nunique()`**
- `nunique()` 方法直接返回 Series 中唯一值的数量。
- **正确**。

3. **C: `len(drinks.country.unique())`**
- `unique()` 方法返回包含唯一值的 NumPy 数组，然后用 `len()` 函数计算该数组的长度。
- **正确**。

4. **D: `len(drinks.country)`**
- 这个表达式计算的是 `country` 列中所有元素的总数，而不是唯一值的数量。
- **不正确**。

### 结论
正确答案是 A, B, 和 C。这些方法均能够正确计算非重复国家名的数量。以下是总结：

| 方法 | 描述 | 正确性 |
|--------------------------------------------------|------------------------------------------|--------|
| `len(drinks.country.value_counts())` | 计算唯一值的频率计数的长度 | ✅ |
| `drinks.country.nunique()` | 直接返回唯一值的数量 | ✅ |
| `len(drinks.country.unique())` | 计算唯一值数组的长度 | ✅ |
| `len(drinks.country)` | 计算总元素个数（不适用于唯一值统计） | ❌ |

这三种正确的方法都能有效获取非重复国家名的数量，在数据分析任务中可以根据具体场景选择使用。