K-means聚类本质上是一种基于欧式距离度量的数据划分方法,均值和方差大的 维度对数据的聚类结果会产生决定性的影响,所以未做标准化处理的数据无法直接参与运算 和比较。所以答案为C。
正确答案是:C: 求距离
专业分析:
在K-means聚类分析中,变量标准化的主要原因是为了求距离。K-means算法通过计算数据点之间的欧氏距离来确定它们的相似性,并将其分配到不同的簇中。如果数据集中的变量具有不同的量纲(例如,一个变量的取值范围是0到1,而另一个变量的取值范围是0到1000),那么在计算距离时,量纲较大的变量会对距离计算结果产生更大的影响,从而导致聚类结果的偏差。
标准化的过程通常包括将每个变量的值减去其均值,然后除以其标准差,使得所有变量的值都在同一个尺度上。这种处理确保了每个变量在距离计算中具有同等的权重,从而提高了聚类结果的准确性和可靠性。