考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

信用卡公司客户希望通过聚类方法定位疑似提供套现服务的商家(POS机),以下那种操作不应该进行: ( )
A. 对变量进行极差标准化
B. 对变量进行百分位秩或Turkey正态性转换
C. 对变量进行因子分析或变量聚类
D. 对变量进行中心标准化
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:B:对变量进行百分位秩或Turkey正态性转换。

### 专业分析:

在进行聚类分析时,数据的预处理是非常重要的一步。以下是对每个选项的分析:

A: **对变量进行极差标准化**
- 极差标准化(Min-Max Scaling)将数据缩放到一个固定范围(通常是0到1),这有助于消除不同变量之间的量纲差异,使得每个变量在聚类分析中具有同等的重要性。这是聚类分析中常用的预处理方法之一。

B: **对变量进行百分位秩或Turkey正态性转换**
- 百分位秩转换和Turkey正态性转换主要用于数据的非线性变换,通常用于提高数据的正态性或处理异常值。然而,这些方法可能会改变数据的分布特性,导致聚类结果失真。因此,这种操作在聚类分析中不太合适。

C: **对变量进行因子分析或变量聚类**
- 因子分析和变量聚类是数据降维和变量选择的方法,可以帮助减少数据的维度,去除冗余信息,使得聚类分析更加高效。这些方法在聚类分析的前处理中也是常用的。

D: **对变量进行中心标准化**
- 中心标准化(Standardization)将数据转换为均值为0,标准差为1的标准正态分布。这有助于消除不同变量之间的量纲差异,使得每个变量在聚类分析中具有同等的重要性。这也是聚类分析中常用的预处理方法之一。

综上所述,选项B的操作不应该进行,因为它可能会改变数据的分布特性,从而影响聚类结果的准确性。