本题考查对聚类分析的理解。组间平方和是总平方和的一个部分,反映了每组均值与总的均值之间的离差,当组间平方和越大时,表明不同组间差距越大,即聚类效果是越好的。组内平方和又称残差平方和,根据n个观察值拟合适当的模型后,余下未能拟合部份称为残差,反映的是所有n个残差平方之和,当组内平方和越小,表明组内数据拟合程度高,也表明聚类效果好。因此本题选AD。
在聚类分析中,评估聚类结果的常用指标是组间平方和(Between-cluster Sum of Squares, BS)和组内平方和(Within-cluster Sum of Squares, WS)。它们分别衡量了类之间的差异和类内部的紧密度。
- **组间平方和(BS)**:表示不同聚类之间的差异程度。BS越大,说明不同聚类之间的差异越显著,聚类效果越好。
- **组内平方和(WS)**:表示同一聚类内部的紧密程度。WS越小,说明同一聚类内部的样本越相似,聚类效果越好。
因此,正确答案是:
A: 组间平方和 BS 越大,聚类效果越好
D: 组内平方和 WS 越小,聚类效果越好
这两个条件同时满足时,说明聚类效果较好。