新用户注册
备考刷题,请到
CDA认证小程序
EFB原理:在高维稀疏数据中,很多特征是互斥的(Mutually Exclusive),即它们不同时为非零值。例如One-Hot编码的多个列。EFB利用图着色算法的思想,将互斥的特征捆绑到同一个Feature Bundle中,通过在该Bundle的直方图中划分不同的数值区间来区分原始特征,从而在无损(或微损)信息的前提下通过降维大幅提升速度。