考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

某量化交易团队计划部署一个高频交易策略,该策略依赖机器学习模型对极短时间内的盘口数据模式进行识别。特征维度为200维,历史训练数据量为500万条。工程团队在评估SVM、逻辑回归、神经网络和KNN后,坚决否决了将KNN作为线上实时推理模型。从系统架构和算法特性的角度看,否决KNN的最核心原因是:
A. KNN模型的可解释性极差。我国的金融监管要求模型必须有足够高的可解释性,因此KNN模型无法满足金融监管对于“白盒模型”的要求。
B. KNN属于“懒惰学习”,训练开销虽然为零,但在线推理阶段需要计算查询点与所有历史数据的距离,推理延迟无法满足高频交易的毫秒级要求。
C. KNN对于非线性模式的识别能力弱于逻辑回归,容易导致大量的收益漏损。
D. 金融数据存在大量的时间序列依赖,而KNN假设样本独立同分布(I.I.D),因此在原理上完全不可用。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

B 正确:这是KNN在工业界大规模实时应用中的最大死穴。逻辑回归或神经网络在推理时只需计算 W ⋅X + b,是一次矩阵乘法,速度极快且与训练集大小无关。而KNN在推理时必须携带整个训练集(或其索引),计算量与数据量 N 成正比。对于500万数据、200维特征,单次预测的计算量是灾难级的。 A 错误:KNN其实具有较好的“基于实例的解释性”(Instance-based explanation),可以说“因为现在的行情像历史上这几次行情”。 C 错误:KNN是非线性模型,拟合能力通常强于线性的逻辑回归。 D 错误:虽然KNN假设IID,但通过滑动窗口构建特征后(Time Delay Embedding),KNN完全可以用于时间序列预测。