-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

某物流公司需要对全国10万个配送网点进行区域划分。业务部门明确要求： 1. 必须预先指定划分为50个大区； 2. 算法计算速度要快，以适应每周的动态调整； 3. 假设网点分布大致呈球形簇状。基于上述需求，最合适的聚类算法是：

A. 层次聚类（Hierarchical Clustering）

B. DBSCAN

C. K-Means

D. 高斯混合模型（GMM）

上一题

下一题

题目解析

题目评论(0)

K-Means算法需要预先指定K值（满足需求1），计算复杂度相对较低，适合大数据量（满足需求2），且在数据呈球形分布时效果最佳（满足需求3）。层次聚类计算复杂度高（O(N^3 )或O(N^2 )），不适合10万级数据；DBSCAN不需要指定簇数且擅长处理任意形状和噪声，但不符合“指定50个大区”的硬性约束；GMM虽然灵活但计算通常比K-Means慢且无需强制指定硬分类。