classifier = tree.DecisionTreeClassifier() train_model(classifier, x_train, y_train, x_test) #可视化特征重要性权重 ========================DecisionTree======================== >>>在训练集上的表现: 0.982521847690387 >>>在测试集上的表现: 0.8444444444444444 >>>预测的 Roc_auc:0.8325 >>>混淆矩阵  labels = X.columns importances = classifier.feature_importances_ # 获取特征权重值 indices = np.argsort(importances)[::-1]# 打印特征等级 features = [labels[i] for i in indices] weights = [importances[i] for i in indices] print("Feature ranking:") for f in range(len(features)): print("%d. %s (%f)" % (f + 1, features[f], weights[f]))# 绘制随机森林的特征重要性 plt.figure() plt.title("Feature importances") plt.bar(features, np.array(weights), color='r') plt.xticks(rotation=90) plt.title('Feature Weights') plt.show() Feature ranking: 1. adult_male (0.313632) 2. fare (0.251215) 3. age (0.237226) 4. pclass (0.117736) 5. parch (0.029511) 6. embarked (0.025722) 7. sibsp (0.017953) 8. sex (0.003675) 9. alone (0.003331) 
时间: 2023-08-09 16:05:14 浏览: 71
Cardiovascular-disease-using-decision-trees-and-random-forest-classifier-:决策树算法可用于预测心血管疾病并使用随机森林分类器和探索性数据分析来提高准确性
这段代码是使用决策树分类器进行特征重要性权重分析和预测,使用了训练集和测试集进行模型训练和测试,并对特征的重要性进行了可视化展示。在这段代码中,我们可以看到使用的特征有adult_male、fare、age、pclass、parch、embarked、sibsp、sex、alone等。其中,adult_male、fare、age和pclass的重要性比其他特征更高。
阅读全文