使用sklearn实现并评估一个回归模型
时间: 2024-11-30 13:19:33 浏览: 28
在Python的Scikit-learn库中,实现和评估一个回归模型通常包括以下几个步骤:
1. **数据预处理**:加载数据集,检查缺失值、异常值,并对数值特征进行标准化或归一化。
```python
from sklearn.datasets import load_boston
import pandas as pd
# 加载波士顿房价数据集
boston = load_boston()
X, y = boston.data, boston.target
```
2. **模型选择**:根据问题选择合适的回归模型,比如线性回归(LinearRegression)、决策树回归(DecisionTreeRegressor)或支持向量回归(SVR)。这里以线性回归为例。
```python
from sklearn.linear_model import LinearRegression
model = LinearRegression()
```
3. **训练模型**:将数据分为训练集和测试集,然后用训练集的数据拟合模型。
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model.fit(X_train, y_train)
```
4. **预测**:使用模型对测试集进行预测。
```python
y_pred = model.predict(X_test)
```
5. **评估**:通过比较实际值(y_test)和预测值(y_pred),使用各种指标如均方误差(Mean Squared Error, MSE)、均方根误差(Root Mean Squared Error, RMSE)或R²分数来评价模型性能。
```python
from sklearn.metrics import mean_squared_error, r2_score
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, y_pred)
print("MSE:", mse)
print("RMSE:", rmse)
print("R² Score:", r2)
```
阅读全文