考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

下列选项中不属于无监督分箱法的是()?
A. 等距分箱法
B. 等频分箱法
C. 卡方分箱法
D. 聚类分箱法
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在无监督学习中,分箱(或称为数据分段)是将连续数据分割成多个区间的过程,这对于数据预处理和特征工程非常重要。以下是对选项中几种分箱方法的分析:

A: **等距分箱法**
- **描述**:无监督分箱方法。等距分箱法将整个数据范围平均分成若干个间隔相等的区间。
- **特点**:区间宽度相等。

B: **等频分箱法**
- **描述**:无监督分箱方法。等频分箱法根据数据样本的数量,将数据分成若干个区间,每个区间包含的样本数量相等。
- **特点**:区间内样本数量相等。

C: **卡方分箱法**
- **描述**:有监督分箱方法。卡方分箱法利用卡方检验来判断如何合并相邻的区间,通常在处理分类问题时使用。
- **特点**:使用标签信息,考虑类别之间的差异。

D: **聚类分箱法**
- **描述**:无监督分箱方法。聚类分箱法使用聚类算法(如k-means)将数据聚集到相似的组中,从而形成分箱。
- **特点**:基于数据聚类。

**正确答案**:C: 卡方分箱法

### 专业分析
- 等距分箱法和等频分箱法都是基于数据的分布特征进行分箱,属于无监督学习的方法。
- 聚类分箱法利用聚类算法对数据进行无监督分类,从而形成分箱。
- 卡方分箱法属于有监督分箱方法,因为它在分箱过程中利用了标签信息(类别信息),以确保分箱后的数据在类别上更具区别性。

因此,选项中不属于无监督分箱法的是 **C: 卡方分箱法**。