python读取docx文档,并且保存为txt格式
时间: 2024-11-18 15:15:44 浏览: 3
在Python中,我们可以使用`python-docx`库来读取`.docx`文档,然后使用内置的文件操作来保存为`.txt`格式。这里是一个简单的步骤:
首先,你需要安装`python-docx`库,如果你还没有安装,可以使用pip命令:
```bash
pip install python-docx
```
然后,你可以使用下面的代码来完成这个任务:
```python
from docx import Document
# 读取.docx文档
def read_docx(file_path):
document = Document(file_path)
# 创建一个空字符串来存储文本内容
text_content = ""
# 遍历文档中的每个段落
for paragraph in document.paragraphs:
text_content += paragraph.text + "\n" # 每个段落后加换行符
return text_content
# 定义要转换的.docx文件路径和目标.txt文件路径
input_file = "path_to_your_docx_file.docx"
output_file = "path_to_save_output_txt_file.txt"
# 读取并保存到txt文件
with open(output_file, 'w', encoding='utf-8') as f:
f.write(read_docx(input_file))
print(f"Document has been successfully converted to txt and saved at {output_file}")
阅读全文