考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

假定某同学使用Naive Bayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中正确的是?(多选)
A. 这个被重复的特征在模型中的决定作用会被加强
B. 模型效果相比无重复特征的情况下精确度会降低
C. 如果所有特征都被重复一遍,得到的模型预测结果相对于不重复的情况下的模型预测结果一样
D. 当两列特征高度相关时,无法用两列特征相同时所得到的结论来分析问题
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

在使用朴素贝叶斯(Naive Bayes, NB)分类模型时,特征的独立性假设是关键假设之一。基于这个假设,我们可以分析特征重复对模型的影响。

### 分析

1. **特征重复的影响**:
- 在朴素贝叶斯中,每个特征都独立贡献于最终的概率估计。如果一个特征被重复,那么在计算类别概率的过程中,这个特征的信息被重复考虑。
- 重复的特征在数学上相当于增加了该特征权重,这可能加强其在决策中的作用。

2. **各选项分析**:
- **A: 这个被重复的特征在模型中的决定作用会被加强**
- **正确**。因重复特征被重复考虑,增加了其对预测的影响。

- **B: 模型效果相比无重复特征的情况下精确度会降低**
- **不一定正确**。重复特征可能导致效用下降或过拟合,特别是在数据量有限时。但是,有时候重复特征可能不会明显降低模型的精度,具体取决于该特征的重要性和数据集的复杂性。

- **C: 如果所有特征都被重复一遍,得到的模型预测结果相对于不重复的情况下的模型预测结果一样**
- **正确**。因为所有特征被同等重复,比例关系保持不变,最终的预测结果不受影响。

- **D: 当两列特征高度相关时,无法用两列特征相同时所得到的结论来分析问题**
- **不准确**。高度相关特征可能导致冗余,但并不意味着无法分析问题。朴素贝叶斯在假设特征独立的情况下仍能运作,只是其假设不再完全成立,可能影响模型性能。

### 总结

- 正确的答案为 **A 和 C**,在特征重复的情况下,重复特征会增加其权重,但如果所有特征都被重复一遍,模型的相对决策并不会变化。