考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

以下叙述正确的是:
A. 数据的缺失都是由机器引起的。
B. 降维的主要手段包括主成分分析、因子分析这些算法。
C. 异常数据就是错误的数据。
D. 在线性回归建模的时候,一般不做数据变换,只有在优化的时候才需要。
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:B: 降维的主要手段包括主成分分析、因子分析这些算法。

专业分析如下:

A: 数据的缺失都是由机器引起的。
- 这句话是不正确的。数据缺失可能由多种原因引起,包括人为错误、数据传输问题、设备故障、系统更新等,不仅仅是机器引起的。

B: 降维的主要手段包括主成分分析、因子分析这些算法。
- 这句话是正确的。降维是一种数据预处理技术,主要手段包括主成分分析(PCA)、因子分析(FA)、线性判别分析(LDA)等,这些方法可以有效地减少数据的维度,同时保留尽可能多的信息。

C: 异常数据就是错误的数据。
- 这句话是不正确的。异常数据不一定是错误的数据。异常数据可能是由于某些特殊情况或极端事件引起的,它们在数据集中表现为离群点,但并不一定是错误的。例如,某些业务中的极端高销售额可能是一次特殊促销活动的结果。

D: 在线性回归建模的时候,一般不做数据变换,只有在优化的时候才需要。
- 这句话是不完全正确的。在线性回归建模中,数据变换(如对数变换、标准化等)是常见的预处理步骤,目的是改善模型的拟合效果和结果解释性。数据变换不仅仅在优化时需要,在建模的初期也可能需要进行。

因此,B是正确的答案。