新用户注册
备考刷题,请到
CDA认证小程序
维数灾难(Curse of Dimensionality)在距离度量上的体现是“距离集中化”(Distance Concentration)。在高维空间中,任意两个随机采样的点之间的距离都倾向于相等。也就是说,最近的邻居和最远的邻居距离相差无几,即 (Distmax-Distmin)/(Dist_min )→0。这导致基于距离远近来判断相似度(如 KNN)或聚类(如 K-Means)的算法失效,因为已经没有“近”和“远”的区别了。