考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某分析师需要整合多源销售数据:首先将12个月的月度销售表格纵向合并,然后与产品维表横向关联,最后按“大区”和“产品类别”分组计算销售额总和并排序。关于这一流程的实现思路,以下说法正确的有?
A. 纵向合并12个月表时,若各月表结构一致,使用 pd.concat(list_of_dfs, ignore_index=True) 可以重置索引,避免索引重复带来的后续干扰。
B. 在与产品维表横向关联时,若主表(销售记录表作为左表)中有大量产品在维表中找不到对应信息,且业务要求保留所有销售记录,应使用 how='left' 左连接。
C. 分组聚合后得到的结果是一个以“大区”和“产品类别”为多级索引(MultiIndex)的Series或DataFrame,若需将其还原为普通列以便后续绘图,可使用 reset_index()。
D. 在最终排序时,若希望先按“大区”升序,再按“销售额”降序排列,可以直接对聚合后的结果调用 sort_values(by=['大区', '销售额'], ascending=[True, False])。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A正确:ignore_index=True 在纵向拼接时非常有用,它生成新的连续整数索引,防止因原始索引重复导致的选择错误或对齐问题。 B正确:左连接(left join)能保留左表(事实表/销售表)的所有行,右表(维表)匹配不上的填NaN,符合“保留所有销售记录”的需求。 C正确:groupby 默认将分组键变为索引,reset_index() 是将多级索引变回普通列的标准操作,便于后续处理或可视化库读取。 D正确:sort_values 完全支持多列混合排序方向,通过列表传递 ascending 参数即可实现复杂排序需求。