多元线性回归模型python
时间: 2023-09-16 14:08:03 浏览: 36
多元线性回归是一种机器学习算法,用于预测一个变量(因变量)与多个自变量之间的关系。在 Python 中,我们可以使用 `scikit-learn` 库中的 `LinearRegression` 类来构建多元线性回归模型。
首先,需要导入所需的库:
```
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
```
然后,我们要准备数据集。假设我们有一个包含多个自变量和一个因变量的数据集 `data.csv`,可以使用 `pandas` 库中的 `read_csv()` 函数读取数据:
```
data = pd.read_csv('data.csv')
```
接下来,我们将数据集拆分为自变量和因变量:
```
x = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
```
然后,我们可以将数据集分为训练集和测试集:
```
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0)
```
接下来,我们可以使用 `LinearRegression` 类来拟合训练集的数据:
```
regressor = LinearRegression()
regressor.fit(x_train, y_train)
```
最后,我们可以使用拟合好的模型来预测测试集的结果:
```
y_pred = regressor.predict(x_test)
```
完整的多元线性回归模型代码如下:
```
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
data = pd.read_csv('data.csv')
x = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0)
regressor = LinearRegression()
regressor.fit(x_train, y_train)
y_pred = regressor.predict(x_test)
```
注意,我们还可以使用其他的回归性能评估方法,如均方误差(Mean Squared Error, MSE)和 R-平方系数(R-squared)。