波士顿房价数据集进行正则化特征选择的代码
时间: 2024-06-15 16:07:34 浏览: 100
波士顿房价数据集是一个经典的机器学习数据集,用于预测波士顿地区房屋价格。正则化特征选择是一种常用的特征选择方法,可以通过对特征进行正则化处理来选择对模型预测性能有贡献的特征。下面是一个使用L1正则化进行特征选择的代码示例:
```python
from sklearn.datasets import load_boston
from sklearn.linear_model import Lasso
from sklearn.preprocessing import StandardScaler
# 加载波士顿房价数据集
boston = load_boston()
X, y = boston.data, boston.target
# 特征标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 使用L1正则化进行特征选择
lasso = Lasso(alpha=0.1) # alpha为正则化强度,根据需要调整
lasso.fit(X_scaled, y)
# 输出选择的特征及其对应的系数
selected_features = [feature for feature, coef in zip(boston.feature_names, lasso.coef_) if coef != 0]
print("Selected features:", selected_features)
```
这段代码首先加载波士顿房价数据集,并进行特征标准化。然后使用Lasso回归模型进行特征选择,其中alpha参数控制正则化强度。最后输出选择的特征及其对应的系数。
阅读全文