新用户注册
备考刷题,请到
CDA认证小程序
K-Means算法需要预先指定K值(满足需求1),计算复杂度相对较低,适合大数据量(满足需求2),且在数据呈球形分布时效果最佳(满足需求3)。层次聚类计算复杂度高(O(N^3 )或O(N^2 )),不适合10万级数据;DBSCAN不需要指定簇数且擅长处理任意形状和噪声,但不符合“指定50个大区”的硬性约束;GMM虽然灵活但计算通常比K-Means慢且无需强制指定硬分类。