举例说明岭回归命令怎么使用
时间: 2023-08-30 14:09:36 浏览: 214
岭回归是一种常用的回归分析方法,它可以解决多重共线性问题,避免过拟合,提高模型的预测能力。在Python中,我们可以使用scikit-learn库中的Ridge类来实现岭回归。
下面是一个简单的例子,展示了如何使用岭回归进行房价预测:
```python
# 导入必要的库
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge
from sklearn.metrics import mean_squared_error
# 加载波士顿房价数据集
boston = load_boston()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(boston.data, boston.target, test_size=0.3, random_state=42)
# 构建岭回归模型
ridge = Ridge(alpha=0.5) # 这里的alpha是超参数,需要根据实际情况调整
# 拟合模型
ridge.fit(X_train, y_train)
# 预测测试集
y_pred = ridge.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print('均方误差为:', mse)
```
在上面的代码中,我们从sklearn.datasets中导入了波士顿房价数据集,然后使用train_test_split函数将数据集划分成训练集和测试集,接着构建了一个alpha为0.5的岭回归模型,使用fit函数拟合模型,最后使用predict函数对测试集进行预测,计算了均方误差。
需要注意的是,alpha是岭回归的超参数,需要根据实际情况进行调整,常用的方法是使用交叉验证来选择最优的超参数。
阅读全文