K-Means异常消费识别数据处理限制-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

在使用K-Means进行异常消费行为识别时，不能对数据进行的处理步骤是：（）

A. 学生标准化

B. 极差标准化

C. Tukey转换

D. 所有货币单位换算为统一标准

上一题

下一题

题目解析

题目评论(0)

在使用K-Means进行异常消费行为识别时，数据预处理是一个重要的步骤。对于K-Means算法，有些数据处理步骤可能不合适或不必要。以下是对选项A、B、C、D的分析：

A. **学生标准化（Standardization/Standard Scaling）**：
学生标准化是指将数据转换为均值为0、标准差为1的标准正态分布。这是常用的K-Means数据预处理方法，因为K-Means依赖于距离（通常是欧式距离），因此数据尺度的一致性很重要。

B. **极差标准化（Min-Max Scaling）**：
极差标准化是将数据缩放到一个固定范围，通常是0到1之间。这也是K-Means常用的预处理方法，因为它将所有特征缩放到相同范围，从而避免因尺度差异影响聚类效果。

C. **Tukey转换**：
Tukey转换是一种用于处理偏态分布或异常值的变换方法。虽然它可以用于某些场景的数据预处理，但对于K-Means来说，并不常见且可能对距离计算产生不期望的影响。

D. **所有货币单位换算为统一标准**：
在进行消费行为分析时，不同货币单位的存在会对结果产生显著影响，因此将货币换算为统一标准是合理的。

**结论：**

- 在以上选项中，选项C（Tukey转换）是不必要且不常用于K-Means的预处理步骤，尤其是在标准化和尺度统一之外使用可能导致距离计算不准确。因此，正确答案是 **C: Tukey转换**。