随机森林特征重要性代码
时间: 2024-03-27 14:32:54 浏览: 71
随机森林是一种集成学习算法,它通过构建多个决策树并综合它们的结果来进行预测。随机森林可以用于特征重要性评估,以下是一个示例代码:
```python
from sklearn.ensemble import RandomForestClassifier
import numpy as np
# 假设你已经有了特征矩阵 X 和目标变量 y
# 创建随机森林分类器对象
rf = RandomForestClassifier()
# 训练随机森林模型
rf.fit(X, y)
# 获取特征重要性
importances = rf.feature_importances_
# 排序特征重要性
indices = np.argsort(importances)[::-1]
# 打印特征重要性排名
for f in range(X.shape[1]):
print("%d. feature %d (%f)" % (f + 1, indices[f], importances[indices[f]]))
```
这段代码使用了scikit-learn库中的RandomForestClassifier类来构建随机森林模型,并通过feature_importances_属性获取特征重要性。然后,使用argsort函数对特征重要性进行排序,并打印出特征重要性的排名。
阅读全文