考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假设 financial_report.xlsx 包含名为 ['Summary', 'Q1', 'Q2', 'Q3', 'Q4', 'Notes'] 的工作表。关于生成的 final_df,以下推断错误的是哪一项? import pandas as pd xls = pd.ExcelFile('financial_report.xlsx') sheet_names = xls.sheet_names data_frames = [] for name in sheet_names: if name.startswith('Q'): temp_df = pd.read_excel( xls, sheet_name=name, usecols="A:D", skiprows=2, dtype={'Region': str} ) temp_df['Source_Sheet'] = name data_frames.append(temp_df) final_df = pd.concat(data_frames, ignore_index=True)
A. final_df 中将只包含来自 Q1, Q2, Q3, Q4 这四个工作表的数据,Summary 和 Notes 被忽略。
B. 每个被读取的工作表中,只有前 4 列(A 到 D)被加载到了内存中。
C. 每个工作表的前 2 行(索引 0 和 1)在读取时被跳过,因此实际的数据列名来自原 Excel 文件的第 3 行。
D. final_df 的行索引将保留原始各个 Excel Sheet 中的行号,且包含一个名为 Source_Sheet 的新列来标记数据来源。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A 正确:循环条件 if name.startswith('Q') 确保只处理以 'Q' 开头的 Sheet(即 Q1-Q4)。 B 正确:usecols="A:D" 限制只读取 A、B、C、D 四列。 C 正确:skiprows=2 会跳过文件头部的前 2 行,使得原文件的第 3 行成为 DataFrame 的列名(Header)。 D 错误: pd.concat(..., ignore_index=True) 的作用是重置索引,生成从 0 开始的连续整数索引,而不会保留原始各个 Sheet 中的行号。 虽然代码中确实添加了 Source_Sheet 列,但前半句关于索引的描述是错误的,因此整项描述错误。