考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

KNN填补缺失值利用的是什么原理
A. 将数据进行聚类并计算出每群的众数或均值来协助进行填补
B. 利用数据在各个维度上的相关性去找出相关数据以便对数据中的缺失值进行填补
C. KNN最近邻算法是计算每个字段的均值或众数并利用计算的结果进行填补
D. KNN填补是用树模型将数据划分到一个假设空间中进行填补
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

B选项就是KNN填补的思路

KNN(K-Nearest Neighbors,K近邻)填补缺失值的原理主要是基于相似性度量来进行填补。具体来说,它通过寻找与缺失值样本最相似的K个邻居,根据这些邻居的值来估计缺失值。因此,正确答案是B:利用数据在各个维度上的相关性去找出相关数据以便对数据中的缺失值进行填补。

### 专业分析

- **KNN填补原理**:
KNN填补缺失值的方法是基于K近邻算法的基本思想。K近邻算法通过计算样本之间的距离(如欧氏距离、曼哈顿距离等),找到与目标样本最相似的K个样本。对于缺失值填补,KNN算法会使用这K个邻居的值来估计缺失值。具体步骤如下:
1. **距离计算**:计算目标样本与其他样本之间的距离。
2. **选择邻居**:选取距离最近的K个邻居。
3. **填补缺失值**:根据邻居的值来填补缺失值,通常可以使用邻居值的均值、众数等方法。

- **选项分析**:
- **A**:将数据进行聚类并计算出每群的众数或均值来协助进行填补。这描述的是基于聚类的方法,而不是KNN。
- **B**:利用数据在各个维度上的相关性去找出相关数据以便对数据中的缺失值进行填补。这描述的是KNN填补的核心思想,即通过寻找相似的邻居来填补缺失值。
- **C**:KNN最近邻算法是计算每个字段的均值或众数并利用计算的结果进行填补。这种描述不准确,KNN并不是直接计算每个字段的均值或众数,而是基于邻居的值来填补。
- **D**:KNN填补是用树模型将数据划分到一个假设空间中进行填补。这描述的是基于树模型的方法,不是KNN。

综上所述,正确答案是B。