根据文件中的代码和已知条件，改进代码，要求训练，测试，验证路径清晰

为了使代码中训练、测试和验证路径更加清晰，并且更好地组织代码结构，可以进行以下改进： 1. **定义常量**：将路径定义为常量，便于管理和修改。 2. **分离数据加载函数**：分别编写加载训练集、验证集和测试集的函数。 3. **优化模型评估和预测部分**：确保模型在训练后能够正确评估和预测。以下是改进后的代码： ```python import os import json import numpy as np import pandas as pd from PIL import Image import tensorflow as tf from sklearn.model_selection import train_test_split from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout from tensorflow.keras.preprocessing.image import ImageDataGenerator from tensorflow.keras.optimizers import Adam from sklearn.metrics import f1_score, accuracy_score # 定义路径常量 TRAIN_DATA_DIR = "C:\\Users\\24067\\Desktop\\peach_split\\train" VAL_DATA_DIR = "C:\\Users\\24067\\Desktop\\peach_split\\val" TEST_DATA_DIR = "C:\\Users\\24067\\Desktop\\peach_split\\test" TRAIN_LABEL_PATH = "C:\\Users\\24067\\Desktop\\train_label.json" VAL_LABEL_PATH = "C:\\Users\\24067\\Desktop\\val_label.json" TEST_LABEL_PATH = "C:\\Users\\24067\\Desktop\\train_label.json" OUTPUT_PATH = "C:\\Users\\24067\\Desktop\\data\\submission.csv" # 加载数据集 def load_data(data_dir, label_path): with open(label_path, 'r') as f: labels_list = json.load(f) labels = {item['文件名']: item['标签'] for item in labels_list if '文件名' in item and '标签' in item} images = [] targets = [] for file_name, label in labels.items(): img_path = os.path.join(data_dir, file_name) if not os.path.exists(img_path): continue img = Image.open(img_path).resize((128, 128)) img_array = np.array(img) / 255.0 images.append(img_array) targets.append(label) if len(images) == 0: raise ValueError("No valid images found.") return np.array(images), np.array(targets) # 加载训练集和验证集 X_train, y_train = load_data(TRAIN_DATA_DIR, TRAIN_LABEL_PATH) X_val, y_val = load_data(VAL_DATA_DIR, VAL_LABEL_PATH) # 标签映射 label_map = {'特级': 3, '一级': 2, '二级': 1, '三级': 0} y_train = np.array([label_map[label] for label in y_train]) y_val = np.array([label_map[label] for label in y_val]) # 创建模型 def create_model(input_shape=(128, 128, 3)): model = Sequential([ Conv2D(32, (3, 3), activation='relu', input_shape=input_shape), MaxPooling2D((2, 2)), Conv2D(64, (3, 3), activation='relu'), MaxPooling2D((2, 2)), Conv2D(128, (3, 3), activation='relu'), MaxPooling2D((2, 2)), Flatten(), Dense(128, activation='relu'), Dropout(0.5), Dense(4, activation='softmax') ]) return model # 实例化模型 model = create_model() # 编译模型 model.compile(optimizer=Adam(learning_rate=0.001), loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 图像增强 datagen = ImageDataGenerator( rotation_range=20, width_shift_range=0.2, height_shift_range=0.2, horizontal_flip=True, vertical_flip=True ) # 训练模型 history = model.fit(datagen.flow(X_train, y_train, batch_size=32), epochs=1, validation_data=(X_val, y_val)) # 评估模型 def evaluate_model(model, X, y): predictions = model.predict(X) predicted_labels = np.argmax(predictions, axis=1) accuracy = accuracy_score(y, predicted_labels) f1 = f1_score(y, predicted_labels, average='weighted') print(f'Accuracy: {accuracy:.4f}') print(f'F1 Score: {f1:.4f}') return accuracy, f1 evaluate_model(model, X_val, y_val) # 预测测试集并保存结果 def predict_and_save(test_data_dir, test_label_path, output_path): test_images = [] test_file_names = [] with open(test_label_path, 'r') as f: test_labels_list = json.load(f) test_labels = {item['文件名']: item['标签'] for item in test_labels_list if '文件名' in item and '标签' in item} for file_name in test_labels.keys(): img_path = os.path.join(test_data_dir, file_name) if not os.path.exists(img_path): continue img = Image.open(img_path).resize((128, 128)) img_array = np.array(img) / 255.0 test_images.append(img_array) test_file_names.append(file_name) test_images = np.array(test_images) predictions = model.predict(test_images) predicted_labels = np.argmax(predictions, axis=1) label_map_inv = {v: k for k, v in label_map.items()} predicted_labels = [label_map_inv[label] for label in predicted_labels] submission_df = pd.DataFrame({'文件名': test_file_names, '标签': predicted_labels}) submission_df.to_csv(output_path, index=False) # 进行预测并保存结果 predict_and_save(TEST_DATA_DIR, TEST_LABEL_PATH, OUTPUT_PATH) ``` ### 改进点说明： 1. **路径常量**：将所有路径定义为常量，方便管理和维护。 2. **数据加载函数**：将加载训练集、验证集和测试集的功能分离到不同的函数中，提高代码可读性和复用性。 3. **标签映射**：在加载数据时直接进行标签映射，避免重复操作。 4. **模型评估和预测**：确保模型在训练后能够正确评估和预测，并生成最终的提交文件。这样改进后的代码结构更加清晰，路径管理也更加规范。

阅读全文

根据文件中的代码和已知条件，改进代码，要求训练，测试，验证路径清晰

相关推荐

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

跟网型逆变器小干扰稳定性分析与控制策略优化simulink仿真模型和代码.zip

16-1文本表示&词嵌入.ipynb

45页-零碳智慧园区标准解决方案：模块化、可扩展且可复制的解决方案.pdf

人脸识别_活体检测_数据录入_登录系统Face_Login_1741778308.zip

学生信息管理平台是一个基于Java Web技术的综合性管理平台

PHP进阶系列之Swoole入门精讲（课程视频）

人脸识别_表情分析_spider运行_数据采集用途_1741771318.zip

美颜_GPUimage_人脸识别_动态贴纸_Demo_1741771705.zip

人脸照片文件批量分辨率裁剪工具

基于强化学习与肌肉长度反馈控制的高效无意识姿态稳定算法研究（可复现，有问题请联系博主）

反编译apk重要的工具之一

计算机视觉_Python_PyQt5_Opencv_综合图像处理与识别跟踪系统.zip

FDTD复现圆偏振超透镜 ,FDTD; 复现; 圆偏振; 超透镜;,FDTD技术在超透镜复现圆偏振的实践

计算机视觉_手势识别_Matlab_交互用途_1741857188.zip

大家在看

对流扩散方程有限体积法

ABAP代码性能指导

RK3588全套硬件设计参考文件，提供原理图和PCB文件！

(信息图)eAPP610 快速入门(3GPP)(V100R005C10-01).zip

C语言第四次作业ppt课件.ppt

最新推荐

vscode使用官方C/C++插件无法进行代码格式化问题

Python实现代码块儿折叠

Python 40行代码实现人脸识别功能

数据挖掘实验报告+代码+截图

dbc文件编写流程及代码格式

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集