实现一个Python函数,使用`LinearRegression`对给定的数据集进行回归分析,并计算均方误差。
时间: 2024-10-19 19:06:02 浏览: 26
在Python中,我们可以使用sklearn库中的`LinearRegression`模型来进行线性回归分析。下面是一个简单的函数示例,它接受一个二维数据数组(特征和目标值)作为输入,拟合线性回归模型,然后返回训练后的模型以及计算出的均方误差(Mean Squared Error,MSE):
```python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
def linear_regression_analysis(X, y):
# 数据分割(通常我们会将80%的数据用于训练,20%用于测试)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测测试集的结果
y_pred = model.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
return model, mse
# 使用函数,假设`X`是特征矩阵,`y`是目标向量
model, mse_value = linear_regression_analysis(X, y)
print(f"模型已创建,均方误差(MSE)为: {mse_value}")
阅读全文