考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

在乳腺癌数据集当中有30个数值型特征,分别代表了30个光片上面的特征,其中包含平均半径,平均光滑度,平均紧凑度等,但数据的量纲不同,请回答以下问题: (1)以下模型中有哪一个是不需要统一量纲的?
A. KNN
B. SVM
C. 随机森林
D. Kmeans
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:C: 随机森林

专业分析:

1. **KNN(K-近邻算法)**:KNN算法通过计算样本间的距离来进行分类或回归,因此特征的量纲对其结果有很大影响。如果特征的量纲不统一,某些特征可能会在计算距离时占据主导地位,导致模型性能下降。因此,KNN需要统一量纲。

2. **SVM(支持向量机)**:SVM算法通过在特征空间中找到一个最佳的超平面来进行分类。特征的量纲不统一会影响到超平面的选择,因为某些特征可能会对模型的决策边界产生过大的影响。因此,SVM也需要统一量纲。

3. **随机森林**:随机森林是基于决策树的集成学习方法。决策树通过特征的分裂来进行决策,而这种分裂是基于特征值的排序和分布。由于决策树不依赖于特征的距离计算,特征的量纲对其影响较小。因此,随机森林不需要统一量纲。

4. **Kmeans(K-均值聚类)**:Kmeans算法通过计算样本点到聚类中心的距离来进行聚类,因此特征的量纲对其结果有很大影响。如果特征的量纲不统一,某些特征可能会在计算距离时占据主导地位,导致聚类结果不准确。因此,Kmeans需要统一量纲。

综上所述,随机森林是上述模型中唯一一个不需要统一量纲的模型。