考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在处理高维稀疏数据(如One-Hot编码后的文本特征)时,LightGBM通过EFB(Exclusive Feature Bundling)算法有效地减少了特征数量。EFB算法能够将多个特征捆绑为一个特征的前提条件是:
A. 这些特征在物理意义上属于同一类别(如都属于“颜色”类)
B. 这些特征的相关性(Correlation)极高,存在严重的多重共线性
C. 这些特征在特征空间中从不(或极少)同时取非零值(互斥性)
D. 这些特征的缺失值比例完全一致
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

EFB原理:在高维稀疏数据中,很多特征是互斥的(Mutually Exclusive),即它们不同时为非零值。例如One-Hot编码的多个列。EFB利用图着色算法的思想,将互斥的特征捆绑到同一个Feature Bundle中,通过在该Bundle的直方图中划分不同的数值区间来区分原始特征,从而在无损(或微损)信息的前提下通过降维大幅提升速度。