考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

关于下面代码执行后的 DataFrame对象df,以下描述正确的是哪一项? import pandas as pd df = pd.read_csv( 'sales_data.csv', sep=';', header=1, skiprows=[0, 4], na_values=['NA', '-', 'N/A'], parse_dates=['order_date'], index_col='order_id' )
A. 文件中的第 1 行(索引为 0)将被用作列名,且第 5 行(索引为 4)的数据会被保留在 DataFrame 中。
B. 文件使用逗号 , 作为分隔符,且 order_date 列将被解析为字符串类型。
C. 第 1 行和第 5 行会被跳过,剩余行的第 2 行(索引为 1)将被用作列名,且值为 - 的单元格会被转换为 NaN。
D. order_id 列将作为普通数据列保留,而 order_date 列将成为 DataFrame 的行索引。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A 错误:header=1 表示使用索引为 1 的行(即文件的第 2 行)作为列名,而不是第 1 行。skiprows=[0, 4] 明确指定跳过索引为 0 和 4 的行(即第 1 行和第 5 行),所以第 5 行不会被保留。 B 错误:sep=';' 指定分隔符为分号,而非逗号。parse_dates=['order_date'] 会将该列解析为 datetime 对象,而非字符串。 C 正确: skiprows=[0, 4]:跳过第 1 行和第 5 行。 header=1:除去原文件第1行和第5行后的剩下的行中的第 2 行作表头。 na_values=['NA', '-', 'N/A']:这些特定字符串会被识别为缺失值 NaN。 D 错误:index_col='order_id' 指定 order_id 列作为行索引,而不是普通数据列;parse_dates 只是解析时间,不会将其设为索引。