考察对 Pandas 底层运算机制的理解。
• A 错误:apply(axis=1) 是 Pandas 中性能较差的操作之一,本质上是在 Python 层面进行行级循环,且每行都会产生 Series 对象的构建开销,速度极慢。
• B 错误 :apply 通常比 List Comprehension 还要慢,因为它涉及 Pandas 内部复杂的索引对齐和对象封装开销。
• C 正确:Pandas 的列式运算(Series * Series)底层直接调用 NumPy 数组操作,能够利用 CPU 的 SIMD 指令集进行真正的向量化计算,速度通常比 apply 快 100 倍以上。
• D 错误:np.vectorize 主要是为了便利性(广播机制),它本质上还是运行 Python 的 for 循环(除非指定 C 签名),性能远不如原生数组运算。