-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

关于下面代码执行后的 DataFrame对象df，以下描述正确的是哪一项？ import pandas as pd df = pd.read_csv( 'sales_data.csv', sep=';', header=1, skiprows=[0, 4], na_values=['NA', '-', 'N/A'], parse_dates=['order_date'], index_col='order_id' )

A. 文件中的第 1 行（索引为 0）将被用作列名，且第 5 行（索引为 4）的数据会被保留在 DataFrame 中。

B. 文件使用逗号 , 作为分隔符，且 order_date 列将被解析为字符串类型。

C. 第 1 行和第 5 行会被跳过，剩余行的第 2 行（索引为 1）将被用作列名，且值为 - 的单元格会被转换为 NaN。

D. order_id 列将作为普通数据列保留，而 order_date 列将成为 DataFrame 的行索引。

上一题

下一题

题目解析

题目评论(0)

A 错误：header=1 表示使用索引为 1 的行（即文件的第 2 行）作为列名，而不是第 1 行。skiprows=[0, 4] 明确指定跳过索引为 0 和 4 的行（即第 1 行和第 5 行），所以第 5 行不会被保留。 B 错误：sep=';' 指定分隔符为分号，而非逗号。parse_dates=['order_date'] 会将该列解析为 datetime 对象，而非字符串。 C 正确： skiprows=[0, 4]：跳过第 1 行和第 5 行。 header=1：除去原文件第1行和第5行后的剩下的行中的第 2 行作表头。 na_values=['NA', '-', 'N/A']：这些特定字符串会被识别为缺失值 NaN。 D 错误：index_col='order_id' 指定 order_id 列作为行索引，而不是普通数据列；parse_dates 只是解析时间，不会将其设为索引。