改进下列代码,加入特征工程
时间: 2023-08-06 07:25:17 浏览: 75
以下是一个简单的 Python 代码示例,演示如何使用特征工程改进线性回归模型:
```python
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
# 加载数据
data = pd.read_csv('data.csv')
# 特征工程
X = data[['x']]
y = data['y']
poly_features = PolynomialFeatures(degree=2, include_bias=False)
X_poly = poly_features.fit_transform(X)
# 计算线性回归模型
lin_reg = LinearRegression()
lin_reg.fit(X_poly, y)
# 输入新的特征值
newX = np.array([[1.5], [2.5], [3.5]])
newX_poly = poly_features.transform(newX)
# 输出预测结果
predY = lin_reg.predict(newX_poly)
print("预测结果:", predY)
```
这段代码演示了如何使用特征工程来改进线性回归模型,包括将原始特征进行二次多项式转化和特征缩放等操作。具体地,我们使用 `PolynomialFeatures` 类将一维特征 `X` 转化成二次多项式特征 `X_poly`,然后使用 `LinearRegression` 类拟合模型并进行预测。在实际场景中,特征工程可以进一步包括数据清洗、特征选择、特征组合等多个环节,以提升模型的预测精度。
阅读全文