利用python-docx批量处理Word文件——表格
时间: 2023-10-22 21:05:04 浏览: 67
可以使用python-docx模块对Word文档中的表格进行批量处理。以下是一个简单的示例代码,可以实现将多个Word文档中的表格内容提取出来并汇总到一个新的Word文档中。
```python
import os
from docx import Document
from docx.shared import Inches
# 创建一个新的Word文档
new_doc = Document()
# 遍历指定目录下的所有Word文档
for filename in os.listdir('path/to/docs'):
if filename.endswith('.docx'):
# 打开Word文档
doc = Document(os.path.join('path/to/docs', filename))
# 遍历文档中的所有表格
for table in doc.tables:
# 新建一个表格
new_table = new_doc.add_table(rows=len(table.rows), cols=len(table.columns))
# 复制表格内容
for i, row in enumerate(table.rows):
for j, cell in enumerate(row.cells):
new_table.cell(i, j).text = cell.text
# 插入一个空行
new_doc.add_paragraph()
# 插入一个分页符
new_doc.add_page_break()
# 保存新的Word文档
new_doc.save('path/to/new_doc.docx')
```
以上代码中,`path/to/docs`为要处理的Word文档所在的目录,`path/to/new_doc.docx`为生成的新的Word文档的路径。代码中使用了`os`模块来遍历目录下的所有Word文档,使用`docx`模块来处理Word文档中的表格。在处理表格时,使用`add_table`方法创建一个新的表格,使用`add_paragraph`方法插入空行,使用`add_page_break`方法插入分页符。