利用sklearn构建线性回归模型
时间: 2024-09-26 08:11:39 浏览: 67
利用scikit-learn (sklearn) 构建线性回归模型通常包括以下几个步骤:
1. 导入所需的库:首先需要导入`sklearn`库,以及数据处理模块如`numpy`、`pandas`。
```python
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
```
2. 数据加载和预处理:如果你的数据存储在一个CSV文件或其他格式,先读取并转换成适合模型训练的数据结构。例如,将类别特征编码为数值。
```python
data = pd.read_csv('your_data.csv')
X = data.drop('target_column', axis=1)
y = data['target_column']
```
3. 分割数据集:将数据分为训练集和测试集,这有助于评估模型性能。
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并初始化模型:实例化一个`LinearRegression`对象。
```python
model = LinearRegression()
```
5. 训练模型:使用训练数据拟合模型。
```python
model.fit(X_train, y_train)
```
6. 预测:对测试集应用模型进行预测。
```python
y_pred = model.predict(X_test)
```
7. 评估模型:使用一些指标来衡量模型的性能,比如均方误差(MSE)和R²分数。
```python
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
print(f"R² Score: {r2}")
```
阅读全文