使用python实现下列要求,一个数组{'.ofd', '.wps', '.pdf', '.xls', '.tif', '.ceb', '.docx', '.doc'},根据不同的类型,从某个windows的文件夹中遍历符合文件后缀的文件,并将文件的文本逐个读取出来
时间: 2023-12-23 08:03:37 浏览: 167
可以使用Python标准库中的os和glob来实现这个功能。下面是代码示例:
```python
import os
import glob
# 遍历文件夹,读取符合类型的文件文本
def read_files_by_type(folder_path, suffixes):
for ext in suffixes:
# 使用glob获取指定后缀的文件列表
files = glob.glob(os.path.join(folder_path, '*' + ext))
for file in files:
with open(file, 'r', encoding='utf-8') as f:
# 逐行读取文件内容
for line in f:
print(line)
# 示例用法
if __name__ == '__main__':
folder_path = r'C:\Users\username\Documents'
suffixes = {'.ofd', '.wps', '.pdf', '.xls', '.tif', '.ceb', '.docx', '.doc'}
read_files_by_type(folder_path, suffixes)
```
上述代码中,`read_files_by_type`函数会遍历指定文件夹下的所有文件,根据文件后缀过滤出符合类型的文件,并逐个读取文件文本内容。我们可以根据需要对读取出的文本进行进一步处理。
阅读全文