sklearn实现多元线性回归
时间: 2023-12-09 21:04:12 浏览: 143
要使用scikit-learn(sklearn)来实现多元线性回归,你需要按照以下步骤进行操作:
1. 导入所需的库和模块:
```python
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
```
2. 准备你的数据集。将自变量(特征)存储在一个二维数组X中,因变量(目标)存储在一个一维数组y中。确保X和y的维度匹配。
3. 将数据集划分为训练集和测试集,可以使用`train_test_split`函数:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
这将把80%的数据用于训练,20%的数据用于测试。
4. 创建一个多元线性回归模型实例:
```python
model = LinearRegression()
```
5. 使用训练数据拟合模型:
```python
model.fit(X_train, y_train)
```
6. 使用测试数据进行预测:
```python
y_pred = model.predict(X_test)
```
7. 评估模型的性能,可以使用均方误差(mean squared error):
```python
mse = mean_squared_error(y_test, y_pred)
```
均方误差值越小,模型的拟合效果越好。
这样你就可以使用scikit-learn实现多元线性回归了。记得根据你的实际情况适当调整代码和参数。
阅读全文