写一个python代码,读入一个表格,建立多元线性回归模型,并评价模型效果。希望评价效果采用多种方式或者画图显示。
时间: 2024-02-15 11:01:22 浏览: 83
好的,我会给您提供一个示例代码,可以读入一个表格,建立多元线性回归模型,并评价模型效果:
```python
import pandas as pd
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt
from sklearn.metrics import r2_score
# 读入数据
data = pd.read_csv('data.csv')
X = data[['x1', 'x2', 'x3']] # 自变量
y = data['y'] # 因变量
# 建立多元线性回归模型
X = sm.add_constant(X) # 添加常数项
model = sm.OLS(y, X).fit() # 拟合模型
# 输出模型概述
print(model.summary())
# 评价模型效果
y_pred = model.predict(X) # 预测值
r2 = r2_score(y, y_pred) # R2系数
print('R2系数:', r2)
# 画图显示
plt.scatter(y, y_pred) # 实际值与预测值的散点图
plt.plot(y, y, 'r') # 画一条 y=x 的直线
plt.xlabel('实际值')
plt.ylabel('预测值')
plt.show()
```
在上面的示例代码中,首先我们使用 Pandas 库读入一个表格数据,然后将自变量和因变量分别提取出来。接着,我们使用 Statsmodels 库建立多元线性回归模型,并输出模型概述。之后,我们使用 Scikit-learn 库计算 R2 系数作为模型效果的评价指标,并使用 Matplotlib 库画出实际值与预测值的散点图,以便直观地观察模型效果。
您可以将代码中的数据文件名 'data.csv' 替换成您实际使用的数据文件名,并根据需要对代码进行修改。
阅读全文
相关推荐














