-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

某量化交易团队计划部署一个高频交易策略，该策略依赖机器学习模型对极短时间内的盘口数据模式进行识别。特征维度为200维，历史训练数据量为500万条。工程团队在评估SVM、逻辑回归、神经网络和KNN后，坚决否决了将KNN作为线上实时推理模型。从系统架构和算法特性的角度看，否决KNN的最核心原因是：

A. KNN模型的可解释性极差。我国的金融监管要求模型必须有足够高的可解释性，因此KNN模型无法满足金融监管对于“白盒模型”的要求。

B. KNN属于“懒惰学习”，训练开销虽然为零，但在线推理阶段需要计算查询点与所有历史数据的距离，推理延迟无法满足高频交易的毫秒级要求。

C. KNN对于非线性模式的识别能力弱于逻辑回归，容易导致大量的收益漏损。

D. 金融数据存在大量的时间序列依赖，而KNN假设样本独立同分布（I.I.D），因此在原理上完全不可用。

上一题

下一题

题目解析

题目评论(0)

B 正确：这是KNN在工业界大规模实时应用中的最大死穴。逻辑回归或神经网络在推理时只需计算 W ⋅X + b，是一次矩阵乘法，速度极快且与训练集大小无关。而KNN在推理时必须携带整个训练集（或其索引），计算量与数据量 N 成正比。对于500万数据、200维特征，单次预测的计算量是灾难级的。 A 错误：KNN其实具有较好的“基于实例的解释性”（Instance-based explanation），可以说“因为现在的行情像历史上这几次行情”。 C 错误：KNN是非线性模型，拟合能力通常强于线性的逻辑回归。 D 错误：虽然KNN假设IID，但通过滑动窗口构建特征后（Time Delay Embedding），KNN完全可以用于时间序列预测。