数据集按照不同类别进了按照文件夹分类,写一个python脚本自动遍历所有文件夹将所有数据集文件重新命名后合在一起
时间: 2024-10-23 11:12:48 浏览: 48
当你需要处理一个按类别划分的文件夹结构的数据集,并希望将其文件合并到一起同时对文件名进行统一重命名,你可以使用Python的os和shutil模块来完成这个任务。下面是一个简单的脚本示例:
```python
import os
import shutil
# 指定数据集目录
dataset_dir = 'your_dataset_directory'
# 新的合并文件存放目录
merged_dir = 'merged_data'
# 遍历每个类别文件夹
for category_folder in os.listdir(dataset_dir):
# 检查是否为文件夹
if os.path.isdir(os.path.join(dataset_dir, category_folder)):
# 获取当前类别文件夹内的所有文件
files_in_category = [f for f in os.listdir(os.path.join(dataset_dir, category_folder)) if os.path.isfile(os.path.join(dataset_dir, category_folder, f))]
# 为新文件指定基础名称(可以包含日期或其他唯一标识)
new_filename_base = 'file_' + category_folder
# 对每个文件进行重命名并移动到新的合并文件夹
for file in files_in_category:
old_path = os.path.join(dataset_dir, category_folder, file)
new_path = os.path.join(merged_dir, new_filename_base + '_' + file) # 使用类别名作为前缀
os.rename(old_path, new_path)
# 如果合并文件夹不存在,创建它
if not os.path.exists(merged_dir):
os.makedirs(merged_dir)
print("数据集文件已按照类别重命名并在{}目录下合并。".format(merged_dir))
阅读全文