在 Pandas 中,处理缺失数据时,常常需要统计数据框中缺失值的数量。对于给定的数据框“df”,需要了解各列中缺失值的数量。下面是对选项的分析:
- **A: df.notnull().mean()**
此语法用于计算非缺失值的比例(不是数量),对于每一列返回一个值,表示该列非缺失值所占的比例。它不是用来统计缺失值数量的。
- **B: df.isnull().mean()**
此语法用于计算缺失值的比例(不是数量),对于每一列返回一个值,表示该列缺失值所占的比例。它也不是直接统计缺失值数量的。
- **C: df.isnull().sum()**
此语法是统计每一列中缺失值的数量。`df.isnull()`返回一个与原数据框大小相同的布尔型数据框,其中缺失值被标记为 `True`,而其他值为 `False`。`sum()`函数在默认情况下对每一列进行求和,结果即为每一列中缺失值的数量。
- **D: df.notnull().sum()**
此语法用于统计每一列中非缺失值的数量。这与统计缺失值数量无关。
因此,正确的答案是:**C: df.isnull().sum()**。它能够准确地统计出数据框“df”中每个列的缺失数据的数量。