考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

关于下面代码执行后的 final_df,以下描述正确的是哪一项? import pandas as pd import numpy as np df = pd.DataFrame({ 'A': [1, 2, np.nan, 4, 5], 'B': [10, np.nan, 30, 40, np.nan], 'C': ['x', 'y', 'z', 'w', 'v'] }) # 步骤 1 df_step1 = df.dropna(subset=['B'], how='any') # 步骤 2 df_step2 = df_step1.fillna({'A': df_step1['A'].mean()}) # 步骤 3 final_df = df_step2.reset_index(drop=True)
A. final_df 共有 5 行,其中列 'A' 的缺失值被填充为 3.0(即 1,2,4,5 的平均值)。
B. final_df 共有 3 行,列 'A' 中原本的缺失值(原索引 2 处)已被移除,因为该行在列 'B' 也有缺失值。
C. final_df 共有 3 行,列 'A' 中的缺失值被填充为 2.5(即剩余非空值 1, 4 的平均值),且索引已重置为 0, 1, 2。
D. final_df 共有 4 行,列 'B' 中的缺失值被填充为 0,列 'A' 的缺失值保持不变。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A 错误:行数不对(应为 3 行),且均值计算基数错了(分母是 2 不是 4)。 B 错误:索引 2 的行在列 'B' 的值是 30(非空),所以不会被 dropna(subset=['B']) 删除。 C 正确:行数 3 行,A 列缺失值填充为 2.5,索引重置。 D 错误:dropna 删除了行而不是填充,且没有对 B 列做填充操作