我们希望能够保留与目标属性相关的特征
正确答案是:A: 多余特征 和 B: 重复特征。
**专业分析:**
特征工程的主要目的是通过对原始数据进行处理和转换,以便模型能够更好地理解和利用这些数据,从而提高预测的准确性和效果。以下是对各个选项的分析:
A: 多余特征——正确。多余特征是指那些对模型预测没有帮助,甚至可能引入噪声的特征。去除这些特征可以简化模型,减少计算复杂度,提高模型的性能。
B: 重复特征——正确。重复特征是指那些在数据集中多次出现且信息相同的特征。保留这些特征没有任何意义,反而会增加模型的复杂度和训练时间,因此应该去除。
C: 与目标属性相关的特征——错误。与目标属性相关的特征是对预测目标有帮助的信息,通常被称为有用特征或重要特征。这些特征应该被保留并进一步优化,以提高模型的预测能力。
D: 目标属性不相关的特征——不完全准确。虽然目标属性不相关的特征确实可能会被去除,但这个描述不够具体。更确切地说,我们希望去除的是那些对预测没有帮助或引入噪声的特征,这通常包括多余特征和重复特征。
综上所述,特征工程的主要目的是去除多余特征和重复特征,从而使模型能够更好地利用数据,提高预测的准确性。