python 实现多元线性回归方程建立模型
时间: 2024-09-07 22:06:10 浏览: 48
在Python中,我们可以使用scikit-learn库来实现多元线性回归模型。多元线性回归是一种统计分析方法,用于预测因变量(目标变量)如何依赖于一个或多个自变量(预测变量)。以下是创建模型的基本步骤:
1. 导入必要的库:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
```
2. 加载数据集,通常是一个CSV文件,可以使用pandas读取:
```python
data = pd.read_csv('your_data.csv') # 替换为你的数据文件路径
```
3. 数据预处理:将数据分为特征(X)和目标变量(y),并分割成训练集和测试集:
```python
X = data[['feature1', 'feature2', ...]] # 根据实际特征列名替换
y = data['target_column'] # 根据实际目标列名替换
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并训练模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. 预测及评估模型性能:
```python
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print("Mean Squared Error:", mse)
print("R^2 Score:", r2)
```