随机森林特征重要性排序代码
时间: 2023-07-10 10:25:30 浏览: 133
下面是使用Python中的sklearn库计算随机森林特征重要性排序的代码:
```python
from sklearn.ensemble import RandomForestClassifier
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 分离特征和标签
X = data.drop('label', axis=1)
y = data['label']
# 创建随机森林模型
rf = RandomForestClassifier(n_estimators=100, random_state=42)
# 训练模型
rf.fit(X, y)
# 获取特征重要性
importances = rf.feature_importances_
# 将特征重要性排序
indices = np.argsort(importances)[::-1]
# 打印特征重要性排名
for f in range(X.shape[1]):
print("%d. feature %d (%f)" % (f + 1, indices[f], importances[indices[f]]))
```
其中,`data.csv`是包含特征和标签的数据文件,`n_estimators`是指定随机森林中的决策树数量,`random_state`是指定随机种子用于保证结果的可重复性。`importances`是一个数组,包含每个特征的重要性分数,`indices`是一个数组,用于存储特征重要性从高到低的排序。最后,通过循环打印出每个特征的重要性排名。
阅读全文