随机森林特征重要性输出的代码
时间: 2023-07-06 19:24:45 浏览: 93
基于随机森林的回归分析代码,输出因子重要性和误差曲线
5星 · 资源好评率100%
以下是使用Python中的sklearn库实现随机森林特征重要性输出的代码:
```python
from sklearn.ensemble import RandomForestRegressor
import pandas as pd
# 读取数据集
data = pd.read_csv('data.csv')
# 定义特征和目标变量
X = data.drop('target_variable', axis=1)
y = data['target_variable']
# 训练随机森林模型
rf = RandomForestRegressor(n_estimators=100, random_state=42)
rf.fit(X, y)
# 输出特征的重要性
importances = list(rf.feature_importances_)
feature_importances = [(feature, round(importance, 2)) for feature, importance in zip(X.columns, importances)]
feature_importances = sorted(feature_importances, key = lambda x: x[1], reverse = True)
[print('Variable: {:20} Importance: {}'.format(*pair)) for pair in feature_importances]
```
在以上代码中,我们首先使用pandas库读取数据集,然后定义特征和目标变量。接着,我们训练随机森林模型,并使用feature_importances_属性获取每个特征的重要性。最后,我们按照重要性降序排列并输出结果。
阅读全文