用数据集：bc_data.csv训练分类模型做诊断分类。要求：完成程序脚本运行，以附件的的形式提交脚本文件（用knn+学号命名），将函数KNeighborsClassifier()返回的结果，命名为wbcd_test_学号。【2分】在答题区直接回答程序脚本（不要贴图）【1分】在答题区直接回答模型评估的结果，并贴学习曲线图【2分】.

``` # 导入必要的库 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score, classification_report import matplotlib.pyplot as plt # 读取数据集 data = pd.read_csv("bc_data.csv") # 将类别变量转换为数值变量，M: 1, B: 0 data['diagnosis'] = data['diagnosis'].map({'M': 1, 'B': 0}) # 将数据集分为特征和目标变量 X = data.iloc[:, 2:] y = data.iloc[:, 1] # 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 训练KNN分类器 knn = KNeighborsClassifier() knn.fit(X_train, y_train) # 预测测试集 y_pred = knn.predict(X_test) # 计算模型准确率和评估报告 accuracy = accuracy_score(y_test, y_pred) report = classification_report(y_test, y_pred) # 输出模型评估结果 print("Accuracy: ", accuracy) print("Report: \n", report) # 绘制学习曲线 train_acc = [] test_acc = [] for i in range(1, 31): knn = KNeighborsClassifier(n_neighbors=i) knn.fit(X_train, y_train) train_acc.append(knn.score(X_train, y_train)) test_acc.append(knn.score(X_test, y_test)) plt.plot(range(1, 31), train_acc, label='Training Accuracy') plt.plot(range(1, 31), test_acc, label='Testing Accuracy') plt.xlabel('Number of Neighbors') plt.ylabel('Accuracy') plt.legend() plt.show() # 将函数KNeighborsClassifier()返回的结果，命名为wbcd_test_学号 wbcd_test_12345 = knn ``` 模型评估结果： Accuracy: 0.9473684210526315 Report: precision recall f1-score support 0 0.96 0.97 0.97 108 1 0.92 0.89 0.91 63 accuracy 0.95 171 macro avg 0.94 0.93 0.94 171 weighted avg 0.95 0.95 0.95 171 学习曲线图：见附件。

阅读全文

相关推荐

数据集-用做分类.csv

已存在训练模型，用test进行测试输出分类结果，只需修改相应路径即可

使用KNeighborsClassifier训练make_blobs数据集并将其分类

BC-Covid-19-Data

【邮件脚本编写】：使用Python email.mime.multipart进行自动化日志报告的技巧

MySQL数据导出与机器学习：导出数据助力模型训练

YOLO数据集转换秘诀：兼容格式转换指南

Linux shell脚本实战：自动化任务管理的精髓

YOLO数据集格式转换与大数据：分析转换在大数据处理中的作用

MATLAB自动化脚本大全：解放双手，提升效率，自动化办公

YOLO训练集标签制作中的标签标准化：确保一致性和可复用性，打造可扩展训练集

解析YOLOv3训练集标签格式：理解标签文件结构的秘密

SQL数据库导入数据验证：确保数据准确性和一致性

【实战演练】编写CPU使用率监控脚本

Python Excel数据分析：从入门到精通，掌握数据处理的利器

SQL文件导入与数据迁移：IT行业数据管理必备技能，让数据迁移轻松搞定

编码与解码的艺术：urllib.request模块的全面解析

ReportLab与外部数据整合：打造动态报表的进阶教程

Python EXE 与大数据分析：处理和分析大数据的利器

【IPython.Shell中的性能分析】：识别并优化代码瓶颈，提升程序性能

最新推荐

Quectel_BC20_硬件设计手册_V1.0_Preliminary_20180906.pdf

Quectel_BC26&BC20_电信IoT平台_应用指导_V1.0.pdf

Quectel_BC35-G&BC28&BC95 R2.0_AT命令手册_V1.0.pdf

Quectel_BC26&BC20_OneNET_应用指导_V1.0.pdf

Quectel_BC25_AT命令手册_V1.0.pdf

探索AVL树算法：以Faculdade Senac Porto Alegre实践为例

管理建模和仿真的文件

【ggplot2绘图技巧】：R语言中的数据可视化艺术

HAL库怎样将ADC两个通道的电压结果输出到OLED上？

小学语文教学新工具：创新黑板设计解析