多元线性回归sklearn使用
时间: 2024-07-20 18:01:13 浏览: 75
多元线性回归是一种统计模型,它用于预测因变量如何依赖于一个或多个自变量。在Python的Scikit-learn库中,`LinearRegression`模块实现了这种回归算法。以下是使用`sklearn`进行多元线性回归的基本步骤:
1. **导入所需库**:
```python
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import pandas as pd
```
2. **加载数据**:
假设你有一个CSV文件包含自变量(X)和因变量(y)的数据,可以用pandas读取:
```python
data = pd.read_csv('your_data.csv')
X = data.iloc[:, :-1] # 自变量(特征)
y = data.iloc[:, -1] # 因变量(目标值)
```
3. **拆分数据集**:
```
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. **创建并训练模型**:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. **评估模型**:
```python
predictions = model.predict(X_test)
```
可以通过计算R²分数、均方误差(MSE)等指标来评估模型性能。
6. **保存或使用模型**:
```python
save_model(model, 'multilinear_regression.pkl') # 仅作为示例,实际操作取决于需求
```
阅读全文