线性回归方程python
时间: 2024-11-08 18:12:46 浏览: 18
线性回归是一种预测分析方法,用于建立因变量与一个或多个自变量之间的线性关系模型。在Python中,我们可以使用sklearn库中的LinearRegression模块来实现线性回归。基本步骤包括数据准备、创建模型、训练模型和预测。
首先,确保已经安装了`numpy`、`pandas`和`scikit-learn`(简称`sklearn`):
```python
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 加载数据(例如CSV文件)
data = pd.read_csv('your_data.csv')
# 数据预处理(如特征选择、缺失值处理等)
X = data[['feature1', 'feature2']] # 输入特征
y = data['target'] # 目标变量
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测
predictions = model.predict(X_test)
# 评估模型性能(例如计算均方误差)
mse = mean_squared_error(y_test, predictions)
print("Mean Squared Error:", mse)
阅读全文