python实现读取doc文档中表格内容并生成到execl中
时间: 2023-06-16 12:04:31 浏览: 73
可以使用 Python 的 `docx` 和 `openpyxl` 库来实现。`docx` 库用于读取 Word 文档,`openpyxl` 库用于生成 Excel 文档。
以下是一个实现的示例代码:
```python
from docx import Document
from openpyxl import Workbook
# 读取 Word 文档
document = Document('example.docx')
# 新建 Excel 文档
workbook = Workbook()
sheet = workbook.active
# 遍历 Word 文档中的表格
for table in document.tables:
for i, row in enumerate(table.rows):
# 将表格中的内容添加到 Excel 文档中
row_data = []
for cell in row.cells:
row_data.append(cell.text)
sheet.append(row_data)
# 保存 Excel 文档
workbook.save('example.xlsx')
```
在此示例代码中,我们首先使用 `Document` 类来读取 Word 文档。然后新建 Excel 文档,并遍历 Word 文档中的每个表格。对于每个表格,我们使用嵌套的循环遍历每一行,并将每个单元格的内容添加到一个列表中。最后将整个列表添加到 Excel 文档的工作表中,并保存 Excel 文档。
需要注意的是,该代码只适用于简单的表格,如果表格中有合并单元格等复杂情况,则需要进行额外的处理。