随机森林的特征选择 python
时间: 2023-10-13 19:06:45 浏览: 82
随机森林Python
5星 · 资源好评率100%
在Python中,使用scikit-learn库可以进行随机森林的特征选择。具体步骤如下:
1. 导入库和数据:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
```
2. 创建随机森林模型:
```python
rf = RandomForestClassifier()
rf.fit(X, y)
```
3. 输出特征重要性:
```python
importances = rf.feature_importances_
print(importances)
```
此时,`importances`变量中存储了每个特征的重要性得分。
4. 可视化特征重要性:
```python
import matplotlib.pyplot as plt
feat_importances = pd.Series(rf.feature_importances_, index=iris.feature_names)
feat_importances.nlargest(4).plot(kind='barh')
plt.show()
```
此时,将输出一个水平条形图,展示了前四个最重要的特征及其重要性得分。
以上即为使用scikit-learn库进行随机森林的特征选择的基本步骤。
阅读全文