| 题目 | 
                        题目类型 | 
                        操作 | 
                    
                                        
                        | 下列选项哪些是通过聚集多个分类器的组合来提高分类准确率的技术? | 
                        普通多选题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 集成学习方法是机器学习领域中用来提升分类算法准确率的技术,主要包括Bagging和Boosting即... | 
                        普通多选题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 数据挖掘结合了数据库、人工智能、机器学习、统计学、高性能计算、模式识别、神经网络、数据可视化、信息检... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 数据挖掘起始于20世纪下半叶,是在当时多个学科发展的基础上发展起来的。关于数据挖掘的发展历程,下列何... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 知识发掘处理(Knowledge Discovery Process)的执行顺序,下列何者是正确的(... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄漏的问题,而在数据清洗过程中(缺... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 在KNN算法上进行预测概率的推估时,会采用哪一种方法,以保证每一类的预测概率不为0 | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 很多研究问题时常常需要估算不同样本之间的相似性度量(Similarity Measurement),... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 无监督学习和监督学习是机器学习最基本的两种类型,下列哪些算法属于无监督学习(Unsupervised... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 不类型的机器学习模型,所使用的模型评价指标也有所不同。一般情况下,以下哪些指标不用于聚类模型评价 | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 关联规则挖掘的目的是在数据项目中找出所有的并发关系,以下可用作数据挖掘分析中的关联规则算法有() | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 数据泛化把较低层次的概念用较高层次的概念替换来汇总数据。以下对于数据泛化描述错误的是: | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | XGBoost是"极端梯度提升"(eXtreme Gradient Boosting)的简称,下面关... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 特征工程是将原始数据转化为特征的过程,这些特征可以更好地向预测模型描述潜在问题,从而提高模型对未见数... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 常见的缺失值填充方法有填充默认值、均值、众数等方式。下面可以对分类变量的缺失值填充的方法是? | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 特征缩放是对输入数据进行标准化所需的重要预处理之一 。关于min-max特征缩放的描述错误的是: | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 逆向文本频率(inversedocument frequency,
IDF)是一个词语普遍重要性的度... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 卡方检验是检验定性自变量对定性因变量的相关性,卡方检验就是统计样本的实际观测值与理论推断值之间的偏离... | 
                        普通选择题 | 
                        
                             去答题
                         | 
                    
                                        
                        | 以下关于递归特征消除法(RFE)的描述中错误的是? | 
                        普通选择题 | 
                        
                             去答题
                         |