首页特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程，通过特征工程我们希望去除掉数据中的

特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程，通过特征工程我们希望去除掉数据中的

时间: 2024-03-04 08:52:47 浏览: 40

特征工程vs.特征提取

本文来自于csdn，本文详细介绍了特征工程和特征提取如何发挥作用,希望对您的学习有帮助。“特征工程”这个华丽的术语，它以尽可能容易地使模型达到良好性能的方式，来确保你的预测因子被编码到模型中。例如，如果你有一个日期字段作为一个预测因子，并且它在周末与平日的响应上有着很大的不同，那么以这种方式编码日期，它更容易取得好的效果。但是，这取决于许多方面。首先，它是依赖模型的。例如，如果类边界是一个对角线，那么树可能会在分类数据集上遇到麻烦，因为分类边界使用的是数据的正交分解（斜树除外）。其次，预测编码过程从问题的特定学科知识中受益最大。在我刚才列举的例子中，你需要了解数据模式，然后改善预测因子的格式。

噪声和冗余，并提取出对于预测模型有意义的特征，以提高模型的性能和可解释性。特征工程通常包括以下步骤： 1. 数据清洗：去除缺失值、异常值和重复值等。 2. 特征选择：选择对于预测模型有意义的特征，去除冗余特征。 3. 特征变换：将原始特征通过数学变换、归一化等方式转换为更适合模型的特征。 4. 特征构建：通过特征组合、特征交叉等方式构建新的特征。通过特征工程，我们可以提高模型的准确率、泛化能力和可解释性，从而更好地应用于实际问题中。

阅读全文