随机森林输出不同特征重要性代码
时间: 2023-12-23 15:56:54 浏览: 72
基于随机森林的回归分析代码,输出因子重要性和误差曲线
5星 · 资源好评率100%
以下是一个简单的随机森林模型,并输出不同特征的重要性代码:
``` python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
# 加载数据集
iris = load_iris()
X, y = iris.data, iris.target
# 构建随机森林模型
rfc = RandomForestClassifier(n_estimators=100, random_state=42)
rfc.fit(X, y)
# 输出各个特征重要性
for feature, importance in zip(iris.feature_names, rfc.feature_importances_):
print(f"{feature}: {importance:.3f}")
```
其中,`n_estimators` 表示随机森林中决策树的数量,`random_state` 为随机种子,保证每次运行结果一致。
在上面的代码中,我们使用了 `load_iris()` 加载了鸢尾花数据集,并将其拆分成了特征矩阵 `X` 和目标向量 `y`。然后,我们使用 `RandomForestClassifier()` 构建了一个包含 100 棵决策树的随机森林模型,并使用 `fit()` 方法对数据进行拟合。
最后,我们使用一个循环遍历特征名称和相应的重要性值,并打印结果。
阅读全文