生成一段python 读取多个docx文件的内容的代码
时间: 2024-02-05 16:10:27 浏览: 111
基于Python获取docx/doc文件内容代码解析
可以使用Python中的`python-docx`库读取docx文件的内容,以下是读取多个docx文件的代码示例:
```python
import os
import docx
# 指定存放docx文件的目录路径
docx_dir = '/path/to/docx/files'
# 获取目录中的所有docx文件路径
docx_files = [os.path.join(docx_dir, f) for f in os.listdir(docx_dir) if f.endswith('.docx')]
# 遍历所有docx文件并读取内容
for docx_file in docx_files:
doc = docx.Document(docx_file)
for para in doc.paragraphs:
print(para.text)
```
上述代码中,首先指定存放docx文件的目录路径,然后获取该目录中所有docx文件的路径,遍历每个docx文件并读取其内容。在遍历每个docx文件时,使用`docx.Document`方法打开该文件,并使用`doc.paragraphs`属性获取文档中的所有段落。遍历每个段落时,使用`para.text`属性获取其文本内容。
阅读全文