考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在统计分析过程中,缺失数据是我们重点关注的对象之一。Pandas提供了强大的函数来处理缺失数据。假设数据表为“df”,下列哪一种语法能够统计df表中的缺失数据的数量( )。
A. df.notnull().mean()
B. df.isnull().mean()
C. df.isnull().sum()
D. df.notnull().sum()
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

考点:缺失值的统计。

在 Pandas 中,处理缺失数据的常见方法包括使用 `isnull()` 和 `notnull()` 函数。对于统计数据框 `df` 中缺失数据的数量,正确的选项是 **C: `df.isnull().sum()`**。下面是对每个选项的分析:

- **A: `df.notnull().mean()`**
- `notnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中值为 True 表示该位置不是缺失值。
- `mean()` 计算各列中非缺失值所占的比例。

- **B: `df.isnull().mean()`**
- `isnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中值为 True 表示该位置是缺失值。
- `mean()` 计算各列中缺失值所占的比例。

- **C: `df.isnull().sum()`**
- `isnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中 True 表示缺失值。
- `sum()` 计算每列中 True 的数量,即缺失值的数量。

- **D: `df.notnull().sum()`**
- `notnull()` 返回一个与 `df` 形状相同的布尔型 DataFrame,其中 True 表示不是缺失值。
- `sum()` 计算每列中 True 的数量,即非缺失值的数量。

因此,正确答案是 **C: `df.isnull().sum()`**,这一语法可以准确统计出 `df` 中每列缺失数据的数量。