随机森林特征重要性python
时间: 2023-11-13 16:57:57 浏览: 109
随机森林特征选取代码,可应用于重要性特征选取和排序,代码运行顺畅+最后出图
好的,关于随机森林特征重要性的问题,你可以使用sklearn库中的RandomForestRegressor或RandomForestClassifier模型来计算特征重要性。具体步骤如下:
1. 导入需要的库和数据集
```python
from sklearn.ensemble import RandomForestRegressor
import pandas as pd
data = pd.read_csv('your_data.csv')
X = data.drop('target', axis=1)
y = data['target']
```
2. 训练随机森林模型并计算特征重要性
```python
rf = RandomForestRegressor(n_estimators=100, random_state=42)
rf.fit(X, y)
importances = rf.feature_importances_
```
3. 可视化特征重要性
```python
import matplotlib.pyplot as plt
feat_importances = pd.Series(importances, index=X.columns)
feat_importances.nlargest(10).plot(kind='barh')
plt.show()
```
这里的n_estimators是指随机森林中树的数量,random_state是随机种子,用于保证每次运行结果一致。
阅读全文