import pandas as pd from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score, confusion_matrix,classification_report import seaborn as sns import matplotlib.pyplot as plt # 读取数据 data = pd.read_excel('E:/桌面/预测脆弱性/20230523/预测样本/预测样本.xlsx') # 分割训练集和验证集 train_data = data.sample(frac=0.8, random_state=1) test_data = data.drop(train_data.index) # 定义特征变量和目标变量 features = ['高程', '起伏度', '桥梁长', '道路长', '平均坡度', '平均地温', 'T小于0', '相态'] target = '交通风险' # 训练随机森林模型 rf = RandomForestClassifier(n_estimators=100, random_state=1) rf.fit(train_data[features], train_data[target]) # 在验证集上进行预测并计算精度、召回率和F1值等指标 pred = rf.predict(test_data[features]) accuracy = accuracy_score(test_data[target], pred) confusion_mat = confusion_matrix(test_data[target], pred) classification_rep = classification_report(test_data[target], pred) print('Accuracy:', accuracy) print('Confusion matrix:') print(confusion_mat) print('Classification report:') print(classification_rep) # 输出混淆矩阵图片 sns.heatmap(confusion_mat, annot=True, cmap="Blues") plt.show() # 读取新数据文件并预测结果 new_data = pd.read_excel('E:/桌面/预测脆弱性/20230523/预测样本/预测结果/交通风险预测096.xlsx') new_pred = rf.predict(new_data[features]) new_data['交通风险预测结果'] = new_pred new_data.to_excel('E:/桌面/预测脆弱性/20230523/预测样本/预测结果/交通风险预测096结果.xlsx', index=False)修改代码使得显示决策树模型以及多分类的roc曲线和auc值

import pandas as pdfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_score, confusion_matriximport seaborn as snsimport matplotlib.pyplot as plt# 读取数据data = pd.read_excel('data.xlsx')# 将数据分为训练集和验证集train_data = data.sample(frac=0.8, random_state=1)test_data = data.drop(train_data.index)# 定义特征变量和目标变量features = ['feature1', 'feature2', 'feature3']target = 'target'# 训练随机森林模型rf = RandomForestClassifier(n_estimators=100, random_state=1)rf.fit(train_data[features], train_data[target])# 在验证集上进行预测并计算精度和混淆矩阵pred = rf.predict(test_data[features])accuracy = accuracy_score(test_data[target], pred)confusion_mat = confusion_matrix(test_data[target], pred)print('Accuracy:', accuracy)print('Confusion matrix:')print(confusion_mat)# 输出混淆矩阵图片sns.heatmap(confusion_mat, annot=True)plt.show()# 读取新数据文件并预测结果new_data = pd.read_excel('new_data.xlsx')new_pred = rf.predict(new_data[features])new_data['predicted_target'] = new_prednew_data.to_excel('predicted_results.xlsx', index=False)改进代码并输出计算分类模型的准确率、召回率和F1值等指标

from sklearn.metrics import accuracy_score, confusion_matrix, classification_report import seaborn as sns import matplotlib.pyplot as plt # 读取数据 data = pd.read_excel('data.xlsx') # 将数据分为...

import pandas as pd from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score, confusion_matrix,classification_report import seaborn as sns import matplotlib.pyplot as plt # 读取数据 data = pd.read_excel('E:/桌面/预测脆弱性/20230523/预测样本/预测样本.xlsx') # 分割训练集和验证集 train_data = data.sample(frac=0.8, random_state=1) test_data = data.drop(train_data.index) # 定义特征变量和目标变量 features = ['高程', '起伏度', '桥梁长', '道路长', '平均坡度', '平均地温', 'T小于0', '相态'] target = '交通风险' # 训练随机森林模型 rf = RandomForestClassifier(n_estimators=100, random_state=1) rf.fit(train_data[features], train_data[target]) # 在验证集上进行预测并计算精度、召回率和F1值等指标 pred = rf.predict(test_data[features]) accuracy = accuracy_score(test_data[target], pred) confusion_mat = confusion_matrix(test_data[target], pred) classification_rep = classification_report(test_data[target], pred) print('Accuracy:', accuracy) print('Confusion matrix:') print(confusion_mat) print('Classification report:') print(classification_rep) # 输出混淆矩阵图片 sns.heatmap(confusion_mat, annot=True, cmap="Blues") plt.show() # 读取新数据文件并预测结果 new_data = pd.read_excel('E:/桌面/预测脆弱性/20230523/预测样本/预测结果/交通风险预测096.xlsx') new_pred = rf.predict(new_data[features]) new_data['交通风险预测结果'] = new_pred new_data.to_excel('E:/桌面/预测脆弱性/20230523/预测样本/预测结果/交通风险预测096结果.xlsx', index=False)制作混淆矩阵的热力图以及多分类的roc曲线和auc值

from sklearn.metrics import multiclass_roc_auc_score, roc_curve, auc # 预测验证集结果 pred_prob = rf.predict_proba(test_data[features]) fpr = dict() tpr = dict() roc_auc = dict() for i in range(3): ...

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import confusion_matrix, classification_report, accuracy_score # 1. 数据准备 train_data = pd.read_csv('train.csv') test_data = pd.read_csv('test_noLabel.csv') # 填充缺失值 train_data.fillna(train_data.mean(), inplace=True) test_data.fillna(test_data.mean(), inplace=True) # 2. 特征工程 X_train = train_data.drop(['Label', 'ID'], axis=1) y_train = train_data['Label'] X_test = test_data.drop('ID', axis=1) scaler = StandardScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) # 3. 模型建立 model = RandomForestClassifier(n_estimators=100, random_state=42) # 4. 模型训练 model.fit(X_train, y_train) # 5. 进行预测 y_pred = model.predict(X_test) # 6. 保存预测结果 df_result = pd.DataFrame({'ID': test_data['ID'], 'Label': y_pred}) df_result.to_csv('forecast_result.csv', index=False) # 7. 模型评估 y_train_pred = model.predict(X_train) print('训练集准确率：', accuracy_score(y_train, y_train_pred)) print('测试集准确率：', accuracy_score(y_test, y_pred)) print(classification_report(y_test, y_pred)) # 8. 绘制柱形图 feature_importances = pd.Series(model.feature_importances_, index=X_train.columns) feature_importances = feature_importances.sort_values(ascending=False) plt.figure(figsize=(10, 6)) sns.barplot(x=feature_importances, y=feature_importances.index) plt.xlabel('Feature Importance Score') plt.ylabel('Features') plt.title('Visualizing Important Features') plt.show() # 9. 对比类分析 train_data['Label'].value_counts().plot(kind='bar', color=['blue', 'red']) plt.title('Class Distribution') plt.xlabel('Class') plt.ylabel('Frequency') plt.show()

feature_importances = pd.Series(model.feature_importances_, index=X_train.columns) feature_importances = feature_importances.sort_values(ascending=False) plt.figure(figsize=(10, 6)) sns.barplot(x=...

RandomForest随机森林处理程序_违约预测_随机森林_

from sklearn.metrics import accuracy_score, confusion_matrix, classification_report import matplotlib.pyplot as plt import seaborn as sns 数据集通常包含多种特征，我们需要对这些特征进行预处理。这...

科比数据.zip

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score 接着，加载CSV文件： python data = pd.read_csv('data.csv') 分析数据前，先查看数据的基本信息，包括列名、...

Demystifying the Confusion Matrix: How to Evaluate the Actual Performance of Classification Models

The Confusion Matrix is a crucial tool in machine learning for evaluating the performance of classification models. It is a table that describes the correspondence between actual categories and ...

Pandas数据合并与重塑：pd.concat深度解析

"pandas数据合并与重塑：pd.concat详解" 在数据分析中，合并和重塑数据是常见的操作。Pandas库提供了强大的工具来处理这些问题，其中之一就是pd.concat()函数。这个函数允许用户按照指定的轴将多个数据结构（如...

野火整合：K60中文文档，pandas pd.read_excel操作详解

import pandas as pd data = pd.read_excel('filename.xlsx') 这里，filename.xlsx是你要读取的Excel文件的路径。函数会默认读取第一个工作表并返回一个DataFrame对象。该函数有多个参数可以调整读取行为...

基于STM32单片机的激光雕刻机控制系统设计-含详细步骤和代码

内容概要：本文详细介绍了基于STM32单片机的激光雕刻机控制系统的设计。系统包括硬件设计、软件设计和机械结构设计，主要功能有可调节激光功率大小、改变雕刻速率、手动定位、精确雕刻及切割。硬件部分包括STM32最小系统、步进电机驱动模块、激光发生器控制电路、人机交互电路和串口通信电路。软件部分涉及STM32CubeMX配置、G代码解析、步进电机控制、激光功率调节和手动定位功能的实现。适合人群：对嵌入式系统和激光雕刻机感兴趣的工程师和技术人员。使用场景及目标：① 适用于需要高精度激光雕刻的应用场合；② 为开发类似的激光雕刻控制系统提供设计参考。阅读建议：本文提供了详细的硬件和软件设计方案，读者应结合实际应用场景进行理解，重点关注电路设计和代码实现。

白色简洁风格的前端网站模板下载.zip

HarmonyException如何解决.md

sdfsdfdsfsdfs222

(177373454)html+css+js学习代码.zip

usbgps2.apk

白色简洁风格的家居建材网站模板下载.zip

EventEmitError解决办法.md

相关推荐

pandas.read_csv参数全面解读与实用示例

Python数据分析：sklearn_cv_pandas库深入应用指南

pandas.read_csv参数全面解析：高效CSV导入与头信息处理

RandomForest随机森林处理程序_违约预测_随机森林_

科比数据.zip

Demystifying the Confusion Matrix: How to Evaluate the Actual Performance of Classification Models

Pandas数据合并与重塑：pd.concat深度解析

野火整合：K60中文文档，pandas pd.read_excel操作详解

基于STM32单片机的激光雕刻机控制系统设计-含详细步骤和代码

白色简洁风格的前端网站模板下载.zip

HarmonyException如何解决.md

sdfsdfdsfsdfs222

(177373454)html+css+js学习代码.zip

usbgps2.apk

白色简洁风格的家居建材网站模板下载.zip

EventEmitError解决办法.md

大家在看

海思芯片规格对比.pdf

C#线上考试系统源码.zip

polsarpro官方教程、操作说明 PolSARpro v5.0 Software Training Course

人工智能技术在数值天气预报中的应用.zip

WRF model前处理.md

最新推荐

基于STM32单片机的激光雕刻机控制系统设计-含详细步骤和代码

白色简洁风格的前端网站模板下载.zip

HarmonyException如何解决.md

sdfsdfdsfsdfs222

(177373454)html+css+js学习代码.zip

掌握HTML/CSS/JS和Node.js的Web应用开发实践

管理建模和仿真的文件

计算机体系结构概述：基础概念与发展趋势

int a[][3]={{1,2},{4}}输出这个数组

勒玛算法研讨会项目：在线商店模拟与Qt界面实现