-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

假设 financial_report.xlsx 包含名为 ['Summary', 'Q1', 'Q2', 'Q3', 'Q4', 'Notes'] 的工作表。关于生成的 final_df，以下推断错误的是哪一项？ import pandas as pd xls = pd.ExcelFile('financial_report.xlsx') sheet_names = xls.sheet_names data_frames = [] for name in sheet_names: if name.startswith('Q'): temp_df = pd.read_excel( xls, sheet_name=name, usecols="A:D", skiprows=2, dtype={'Region': str} ) temp_df['Source_Sheet'] = name data_frames.append(temp_df) final_df = pd.concat(data_frames, ignore_index=True)

A. final_df 中将只包含来自 Q1, Q2, Q3, Q4 这四个工作表的数据，Summary 和 Notes 被忽略。

B. 每个被读取的工作表中，只有前 4 列（A 到 D）被加载到了内存中。

C. 每个工作表的前 2 行（索引 0 和 1）在读取时被跳过，因此实际的数据列名来自原 Excel 文件的第 3 行。

D. final_df 的行索引将保留原始各个 Excel Sheet 中的行号，且包含一个名为 Source_Sheet 的新列来标记数据来源。

上一题

下一题

题目解析

题目评论(0)

A 正确：循环条件 if name.startswith('Q') 确保只处理以 'Q' 开头的 Sheet（即 Q1-Q4）。 B 正确：usecols="A:D" 限制只读取 A、B、C、D 四列。 C 正确：skiprows=2 会跳过文件头部的前 2 行，使得原文件的第 3 行成为 DataFrame 的列名（Header）。 D 错误： pd.concat(..., ignore_index=True) 的作用是重置索引，生成从 0 开始的连续整数索引，而不会保留原始各个 Sheet 中的行号。虽然代码中确实添加了 Source_Sheet 列，但前半句关于索引的描述是错误的，因此整项描述错误。