数据集按照不同类别进了按照文件夹分类,写一个python脚本将所有数据集文件合在一起
时间: 2024-10-23 18:09:09 浏览: 25
当你需要将按照类别分布在不同文件夹下的数据集文件合并到一起,可以使用Python的os模块来遍历文件夹,并使用shutil模块复制或移动文件。下面是一个基本的脚本示例:
```python
import os
import shutil
# 定义源目录、目标目录以及类别列表
source_dir = 'your_source_directory' # 比如 '/path/to/data/folders'
target_dir = 'merged_data_folder' # 合并后的文件夹位置
categories = ['category1', 'category2', 'category3'] # 文件夹内文件的类别名称
# 遍历每个类别
for category in categories:
src_category_path = os.path.join(source_dir, category)
if not os.path.exists(target_dir): # 如果目标目录不存在,则创建它
os.makedirs(target_dir)
# 遍历源目录下该类别内的所有文件
for filename in os.listdir(src_category_path):
src_file_path = os.path.join(src_category_path, filename)
dst_file_path = os.path.join(target_dir, filename) # 目标文件路径
# 使用shutil.copy2进行文件合并(保留元数据)
shutil.copy2(src_file_path, dst_file_path)
print("数据集文件已合并完成.")
#
阅读全文