我们希望能够保留与目标属性相关的特征
正确答案是:A: 多余特征 和 B: 重复特征。
特征工程的主要目的是通过处理和转换原始数据来提高模型的性能和预测准确性。在这个过程中,我们希望去除掉一些不必要的特征,以减少噪音并提高模型的泛化能力。以下是对各个选项的分析:
A: 多余特征
多余特征是指那些对模型预测没有帮助,甚至可能引入噪音的特征。去除这些特征可以简化模型,减少过拟合的风险,提高模型的泛化能力。
B: 重复特征
重复特征是指那些在数据集中基本上提供相同信息的特征。保留这些特征不会增加模型的信息量,反而会增加计算复杂度。去除重复特征可以使模型更简洁高效。
C: 与目标属性相关的特征
与目标属性相关的特征是指那些对预测目标有显著影响的特征。这些特征是模型预测的关键,应该保留。
D: 与输入属性相关的特征
与输入属性相关的特征通常是指那些在输入数据中有显著关系的特征。它们可能包含重要的信息,有助于提高模型的预测性能,因此不应该去除。
综上所述,特征工程的目标是去除多余特征和重复特征,保留那些与目标属性和输入属性相关的重要特征。