R2的定义
在系统聚类法中,R² 通常用于衡量聚类结果的好坏。R² 值越高,说明聚类结果越好,聚类的效果越明显。R² 的定义为:
\[ R² = \frac{\text{组间离差平方和}}{\text{总离差平方和}} \]
因此,正确答案是:
C: 组间离差平方和除以总离差平方和
### 专业分析:
- **组内离差平方和 (Within-cluster sum of squares, WSS)**:指的是每个簇内数据点与该簇中心之间距离的平方和,反映了簇内数据的紧密程度。
- **组间离差平方和 (Between-cluster sum of squares, BSS)**:指的是簇中心与总体数据中心之间的距离平方和,反映了不同簇之间的分离程度。
- **总离差平方和 (Total sum of squares, TSS)**:是数据点与总体数据中心之间距离的平方和,等于组内离差平方和与组间离差平方和之和。
公式如下:
\[ TSS = WSS + BSS \]
R² 的计算公式:
\[ R² = \frac{BSS}{TSS} \]
R² 值介于 0 和 1 之间,值越接近 1,表示聚类效果越好,即组间差异越大,组内差异越小。