在这一步查看模型精确度# 导入必要的库 import numpy as np import pandas as pd from sklearn.ensemble import RandomForestRegressor # 读取数据集 data = pd.read_csv('data.csv') # 分离自变量和因变量 X = data.drop('y', axis=1) y = data['y'] # 构建随机森林模型 rf = RandomForestRegressor(n_estimators=100, max_depth=5, random_state=0) # 训练模型并计算特征重要性 rf.fit(X, y) importance = rf.feature_importances_ # 对特征重要性进行排序 indices = np.argsort(importance)[::-1] # 输出变量重要性序列 print("Feature ranking:") for f in range(X.shape[1]): print("%d. feature %d (%f)" % (f + 1, indices[f], importance[indices[f]]))
时间: 2024-04-28 12:23:04 浏览: 93
python数据分析与可视化 import pandas as pd import numpy as np import m
这段代码是用随机森林算法进行特征重要性排序和打印输出。具体来说,这段代码的步骤如下:
1. 导入必要的库:numpy、pandas和RandomForestRegressor。
2. 读取数据集:从CSV文件中读取数据。
3. 分离自变量和因变量:将自变量和因变量从数据集中分离出来。
4. 构建随机森林模型:使用RandomForestRegressor函数构建一个随机森林模型,并指定一些参数,如n_estimators、max_depth和random_state等。
5. 训练模型并计算特征重要性:使用fit函数对模型进行训练,并计算出每个特征的重要性。
6. 对特征重要性进行排序:使用argsort函数对特征重要性进行排序,并倒序输出。
7. 输出变量重要性序列:将每个特征的重要性按照倒序输出。
阅读全文