考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

为了分析客户的类型,分析师小A进行了一次聚类分析。在评估聚类结果时,( )(多选)
A. 组间平方和BSS越大,聚类效果越好
B. 组间平方和BSS越小,聚类效果越好
C. 组内平方和WSS越大,聚类效果越好
D. 组内平方和WSS越小,聚类效果越好
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

我们一般可以近似地用组间平方和BSS(Between Sum of Squares)和组内平方和WSS(Within Sum of Squares)来作为评价指标判断聚类的类别数是否合适。BSS越大,WSS越小,聚类的效果就越好。

在聚类分析中,评估聚类效果通常使用组间平方和(BSS)和组内平方和(WSS)。对这些指标的分析如下:

- **组间平方和(BSS,Between Sum of Squares)**:用于衡量聚类中心之间的差异。BSS越大,聚类中心之间的差异越大,说明不同簇之间的距离越远,聚类效果越好。

- **组内平方和(WSS,Within Sum of Squares)**:用于衡量同一聚类内部数据点的紧密程度。WSS越小,同一聚类内部数据点之间的距离越小,说明聚类内部的点更紧密,聚类效果越好。

根据以上分析,正确答案是:

- A: 组间平方和BSS越大,聚类效果越好
- D: 组内平方和WSS越小,聚类效果越好

### 专业分析

| 指标 | 描述 | 理想状态 |
|----------------|------------------------------------------------------------|--------------------------|
| 组间平方和 (BSS) | 衡量不同簇之间的差异,值越大说明簇间差异越明显,簇划分越清晰。 | 尽可能大 |
| 组内平方和 (WSS) | 衡量同一簇内的数据点的紧密性,值越小说明簇内数据点越接近,簇更紧密。 | 尽可能小 |

通过调整聚类过程中簇的数量等参数,在平衡BSS和WSS的基础上追求最优的聚类效果。通常在实际应用中,也会使用诸如轮廓系数(Silhouette Score)这样的综合指标来进一步验证聚类的质量。