考点:缺失值的统计。
在 Pandas 中,处理缺失数据的常见方法包括使用 `isnull()` 和 `notnull()` 函数。对于统计数据框 `df` 中缺失数据的数量,正确的选项是 **C: `df.isnull().sum()`**。下面是对每个选项的分析:
- **A: `df.notnull().mean()`**
- `notnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中值为 True 表示该位置不是缺失值。
- `mean()` 计算各列中非缺失值所占的比例。
- **B: `df.isnull().mean()`**
- `isnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中值为 True 表示该位置是缺失值。
- `mean()` 计算各列中缺失值所占的比例。
- **C: `df.isnull().sum()`**
- `isnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中 True 表示缺失值。
- `sum()` 计算每列中 True 的数量,即缺失值的数量。
- **D: `df.notnull().sum()`**
- `notnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中 True 表示不是缺失值。
- `sum()` 计算每列中 True 的数量,即非缺失值的数量。
因此,正确答案是 **C: `df.isnull().sum()`**,这一语法可以准确统计出 `df` 中每列缺失数据的数量。