训练集中有多个文件夹怎么读取
时间: 2024-03-03 13:51:19 浏览: 60
如果训练集中有多个文件夹,你可以使用Python内置的os模块来读取这些文件夹中的文本文档。示例代码如下:
```python
import os
train_dir = 'train_data' # 训练集文件夹路径
for root, dirs, files in os.walk(train_dir):
for filename in files:
if filename.endswith('.txt'):
with open(os.path.join(root, filename), 'r', encoding='utf-8') as f:
data = f.read()
# 处理训练数据
```
上述代码中,`os.walk()`函数会遍历指定路径下的所有文件夹,返回每个文件夹的路径、子文件夹列表和文件列表。你可以根据文件名的后缀来判断文件类型,然后使用open()函数读取每个文本文档并处理训练数据。如果你只需要遍历指定路径下的文件夹,可以在os.walk()函数中指定topdown参数为True,示例代码如下:
```python
import os
train_dir = 'train_data' # 训练集文件夹路径
for root, dirs, files in os.walk(train_dir, topdown=True):
dirs[:] = [d for d in dirs if os.path.join(root, d).startswith(train_dir)]
for filename in files:
if filename.endswith('.txt'):
with open(os.path.join(root, filename), 'r', encoding='utf-8') as f:
data = f.read()
# 处理训练数据
```
上述代码中,`dirs[:] = [d for d in dirs if os.path.join(root, d).startswith(train_dir)]`用于过滤掉非指定路径下的文件夹。
阅读全文