正确答案是:B: kmeans聚类中以每一类的均值作为类的中心
专业分析:
A: 初始时,先将每个样本看做单独一类,然后计算两两样本之间的距离
- 这描述的是层次聚类(Hierarchical Clustering)的初始步骤,而不是kmeans聚类的方法。kmeans聚类的初始步骤是随机选择k个初始中心点。
B: kmeans聚类中以每一类的均值作为类的中心
- 这是正确的描述。kmeans聚类算法的核心思想是通过迭代的方法,将数据点分配到k个簇中,并不断更新每个簇的中心点(均值),直到收敛。
C: kmeans聚类需要不断计算类与类之间的距离
- 这也是错误的。kmeans聚类的过程是计算每个数据点到各个簇中心(均值)的距离,然后将数据点分配到最近的簇中心,而不是计算类与类之间的距离。
D: kmeans聚类最终会将所有的观测聚为一类
- 这也是错误的描述。kmeans聚类的目标是将数据点分成k个簇,而不是将所有数据点聚为一类。
因此,B选项是正确的。