python 将文件夹下所有的doc或者docx文件合并到一个txt文件中
时间: 2024-04-15 11:30:02 浏览: 151
你可以使用Python的`os`和`docx`库来实现将文件夹下所有的`.doc`或`.docx`文件合并到一个`.txt`文件中。以下是一个实现的示例代码:
```python
import os
from docx import Document
# 指定文件夹路径和目标txt文件路径
folder_path = 'path/to/folder'
output_file = 'path/to/output.txt'
# 获取文件夹中所有的doc和docx文件
files = [f for f in os.listdir(folder_path) if f.endswith(('.doc', '.docx'))]
# 创建一个空的txt文件
with open(output_file, 'w', encoding='utf-8') as output:
# 遍历所有文件
for file in files:
file_path = os.path.join(folder_path, file)
# 使用docx库读取doc或docx文件内容
doc = Document(file_path)
paragraphs = [p.text for p in doc.paragraphs]
# 将内容写入txt文件
output.write('\n'.join(paragraphs))
output.write('\n') # 每个文件后添加一个换行符
```
你需要将`folder_path`替换为你要操作的文件夹路径,将`output_file`替换为你要输出的txt文件路径。在运行代码之前,确保已安装`docx`库(使用`pip install python-docx`安装)。
运行代码后,它将遍历指定文件夹中的所有`.doc`和`.docx`文件,将它们的内容逐行写入指定的txt文件中,每个文件之间用一个换行符分隔。
阅读全文