关于 bagging 和 boosting 的正确说法如下:
- **A: bagging的中树是相互独立,而 boosting 的中树不是相互独立**
**正确**。Bagging(Bootstrap Aggregating)的基本思想是通过对数据集进行有放回的随机抽样生成多个训练集,训练集之间是独立的,因此训练出的模型也是相互独立的。而 Boosting 属于逐步加权的过程,每个模型的构建是依赖于前面模型的结果,所以树不是相互独立的。
- **B: bagging可以使用随机特征子集**
**正确**。Bagging 可以结合随机特征选择算法来构建模型的每个基学习器,最经典的例子是随机森林(Random Forest),它在构建每棵树时不但使用了 bagging 还随机选择特征子集。
- **C:在boosting 中可以生成并行树,因为它们是相互独立的**
**错误**。在 Boosting 中,基学习器是顺序生成的,每个基学习器都需要根据前一个学习器的错误进行调整和更新,产生依赖性,所以 Boosting 不能并行生成模型。
- **D: 无论任何数据,bagging 总是优于 boosting**
**错误**。Bagging 和 Boosting 各有优缺点和适用范围,没有哪一个方法在所有数据集上都能始终优于另一个。Bagging 通常在减少模型的方差上表现较好,而 Boosting 在提高模型的偏差上有优势。在某些数据集上,Boosting 能够通过降低偏差来显著提升性能。
综上所述,正确答案是:**A 和 B**。