python提取excel两列数据做线性回归,生成模型代码
时间: 2024-09-22 10:03:27 浏览: 49
在Python中,我们可以使用pandas库来处理Excel文件,sklearn库来进行线性回归分析。下面是一个简单的例子,假设你有两列数据分别存储在Excel的A列和B列,你想基于这两列数据创建一个简单的线性回归模型:
```python
# 导入需要的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
# 加载Excel数据
df = pd.read_excel('your_file.xlsx') # 替换 'your_file.xlsx' 为你实际的文件名
X = df['A'] # 假设A列是自变量
y = df['B'] # 假设B列是因变量
# 将数据分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并拟合线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 计算模型性能指标
print('均方误差:', metrics.mean_squared_error(y_test, y_pred))
print('R²分数:', metrics.r2_score(y_test, y_pred))
# 如果你需要保存模型
# model.save('linear_regression_model.pkl') # 这里假设有一个save函数用于保存模型
```
阅读全文