SHHB_train数据集txt处理与图片划分脚本

需积分: 10 60 浏览量更新于2024-09-07 收藏 20KB DOCX 举报

SHHB_train数据集是一个针对特定任务的人头坐标标注数据集，主要用于图像识别或对象检测领域，特别是人脸检测中的行人头部位置检测。该数据集的txt格式文件包含了图像的路径以及对应的头部坐标信息。原始代码片段展示了如何处理这个数据集，包括读取图像路径、将数据集划分为训练集和验证集，并对图像进行分离存储。首先，导入了必要的库，如`glob`, `os`, `numpy`, 和 `shutil`，以及 `PIL` 用于图像操作。`START_BOUNDING_BOX_ID=0` 可能是用于标记每个头部坐标框的起始标识符。函数`val_train`的主要步骤如下： 1. 定义训练图片和验证图片的路径，确保它们不存在时创建新的目录。 2. 划分训练集和验证集：通过`train_ratio=0.9`定义了90%的图片用于训练，其余用于验证。使用`glob.glob`获取SHHB_train目录下的所有.jpg文件，并按顺序排序，然后随机打乱以便划分。 3. 将文件列表分割为训练列表和验证列表。 4. 创建一个名为`SHHB_train.txt`的文件，用于保存训练图片的路径；创建另一个文件`pro_train`，用于后续可能的其他处理。 5. 遍历训练图片列表，将图片路径写入`SHHB_train.txt`，同时复制图片到训练图片目录。 6. 对于每个图片，从SHHB_txt文件中读取对应行，进一步处理每条包含头部坐标信息的文本行。这部分代码的核心目的是预处理SHHB_train数据集，使其适应基于PyTorch-YOLOv3等深度学习模型的训练。用户需要提供SHHB_img（图像文件夹路径）和SHHB_txt（包含坐标标注的文本文件路径），通过这段代码可以生成用于训练的人脸头部标注的训练和验证数据。然而，由于代码中提到“找不到txt文本的代码”，可能意味着作者在处理标注文件时遇到了问题，例如解析和提取坐标，这需要额外的解析步骤。总结来说，SHHB_train数据集处理的关键在于读取文本文件中的坐标信息，并将其与图像路径关联起来，形成可用于训练和验证的格式。此外，代码中还有文件管理和数据划分的部分，这些都是训练深度学习模型前常见的数据准备步骤。

import glob

import os

import numpy as np

import shutil

from PIL import Image

START_BOUNDING_BOX_ID = 0

def val_train(SHHB_img,

SHHB_txt,pro_train,pro_valid):

train_img = 'D:\project\PyTorch-YOLOv3-master\

data\custom\images\SHHB_train\' #分离的训练图

片路径

val_img = 'D:\project\PyTorch-YOLOv3-master\

data\custom\images\SHHB_valid\' #分离的验证集

图片路径

if os.path.exists(train_img): #创建文件夹

shutil.rmtree(train_img)

os.makedirs(train_img)

if os.path.exists(val_img):

shutil.rmtree(val_img)

os.makedirs(val_img)

train_ratio = 0.9 #保留 90%的图片为训练图片

train_list = glob.glob(SHHB_img + '/*.jpg')

train_list = np.sort(train_list)

np.random.seed(100)

np.random.shuffle(train_list)

train_num = int(len(train_list) * train_ratio)

img_list_train = train_list[:train_num]

img_list_val = train_list[train_num:]

f1 = open('SHHB_train.txt','w') #把数

据的路径写入到文件夹

f = open(pro_train, 'w')

for img in img_list_train:

f1.write(img + '')

下载后可阅读完整内容，剩余6页未读，立即下载

那就好灬

粉丝: 0
资源: 1

SHHB_train数据集txt处理与图片划分脚本

浅析计算机视觉人群计数C3框架中__C_SHHB.LOG_PARA = 100.这行代码的作用

果壳处理器研究小组(Topic基于RISCV64果核处理器的卷积神经网络加速器研究)详细文档+全部资料+优秀项目+源码.zip

JSP学生学籍管理系统（源代码+论文+开题报告+外文翻译+答辩PPT）(2024x5).7z

LabVIEW实现NB-IoT通信【LabVIEW物联网实战】

【java毕业设计】智慧社区综合平台（源代码+论文+PPT模板）.zip

基于python3+selenium+unittest的WebUI自动化测试框架，使用POM(页面对象模型)设计模式，适合几乎所有web项目，资料齐全+详细文档

智能车开发案例，使用Python语言在一个文件中实现 这里我们将添加一些额外的功能，如自动驾驶模式、避障、超声波传感器读取以及通过TCP/IP网络远程控制

屏幕截图 2024-12-21 165859.png

电缆、树木检测15-YOLO（v5至v11）、COCO、CreateML、Paligemma、TFRecord、VOC数据集合集.rar

【湍流】基于matlab RANS湍流通道流【含Matlab源码 9913期】.zip

最新资源

智能车开发案例，使用Python语言在一个文件中实现这里我们将添加一些额外的功能，如自动驾驶模式、避障、超声波传感器读取以及通过TCP/IP网络远程控制