新用户注册
备考刷题,请到
CDA认证小程序
针对严重右偏(长尾)的连续型特征,直接标准化效果不佳,因为均值和方差受极值影响大。标准的处理流程是:先进行非线性变换(如对数变换 Log Transform、Box-Cox变换)使分布接近正态,消除长尾影响;然后再进行中心标准化(Z-Score)或归一化,以消除量纲影响,适应基于距离或假设正态分布的算法。