def data_set_split(src_data_folder, target_data_folder, train_scale=0.8, val_scale=0.1, test_scale=0.1): print("开始数据集划分") class_names = os.listdir(src_data_folder) split_names = ['train', 'val', 'test'] for split_name in split_names: split_path = os.path.join(target_data_folder, split_name) if os.path.isdir(split_path): pass else: os.mkdir(split_path) for class_name in class_names: class_split_path = os.path.join(split_path, class_name) if os.path.isdir(class_split_path): pass else: os.mkdir(class_split_path)
时间: 2023-07-14 20:12:57 浏览: 96
New-folder-(2).rar_The Signal_ecg signal matlab_original_data_re
这段代码实现了一个数据集划分的功能,将源数据文件夹中的数据按照一定比例划分为训练集、验证集和测试集,并将划分后的数据保存在目标数据文件夹中。其中,train_scale、val_scale 和 test_scale 分别表示训练集、验证集和测试集的比例。class_names 表示源数据文件夹中的分类名称,split_names 表示要划分的数据集名称。对于每个数据集名称,先在目标数据文件夹中创建一个相应的文件夹,然后针对每个分类名称,再在相应的数据集文件夹中创建一个相应的分类文件夹。最终实现了将数据按比例划分并保存到目标文件夹的功能。
阅读全文