考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在统计分析过程中,缺失数据是我们重点关注的对象之一。Pandas提供了强大的函数来处理缺失数据。假设数据表为“df”,下列哪一种语法能够统计df表中的缺失数据的数量( )。 
A. df.notnull().mean()
B. df.isnull().mean()
C. df.isnull().sum()
D. df.notnull().sum()
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在 Pandas 中,处理缺失数据时,常常需要统计数据框中缺失值的数量。对于给定的数据框“df”,需要了解各列中缺失值的数量。下面是对选项的分析:

- **A: df.notnull().mean()**
此语法用于计算非缺失值的比例(不是数量),对于每一列返回一个值,表示该列非缺失值所占的比例。它不是用来统计缺失值数量的。

- **B: df.isnull().mean()**
此语法用于计算缺失值的比例(不是数量),对于每一列返回一个值,表示该列缺失值所占的比例。它也不是直接统计缺失值数量的。

- **C: df.isnull().sum()**
此语法是统计每一列中缺失值的数量。`df.isnull()`返回一个与原数据框大小相同的布尔型数据框,其中缺失值被标记为 `True`,而其他值为 `False`。`sum()`函数在默认情况下对每一列进行求和,结果即为每一列中缺失值的数量。

- **D: df.notnull().sum()**
此语法用于统计每一列中非缺失值的数量。这与统计缺失值数量无关。

因此,正确的答案是:**C: df.isnull().sum()**。它能够准确地统计出数据框“df”中每个列的缺失数据的数量。