python提取批量word指定表格内容到excel,代码
时间: 2024-10-13 14:18:20 浏览: 59
批量提取word表格数据到excel文档
在Python中,我们可以使用`python-docx`库处理Word文档,`pandas`库来操作Excel。以下是一个基本的示例,展示如何从Word文件中的每个表格提取数据并保存到Excel:
```python
from docx import Document
import pandas as pd
# 定义读取Word文档函数
def extract_tables_from_word(word_file, excel_writer):
doc = Document(word_file)
# 遍历文档中的所有表格
for table in doc.tables:
# 将表格转换成DataFrame
df_table = pd.DataFrame(table.rows)
# 转换表格数据为正确的列名(如果有的话)
if len(df_table.iloc[0]) > 1: # 如果表头存在
df_table.columns = df_table.iloc[0]
df_table = df_table.drop(0) # 删除表头行
# 写入Excel
df_table.to_excel(excel_writer, sheet_name=table.name or 'Sheet', index=False)
# 使用上面的函数,传入Word文件路径和一个ExcelWriter对象
word_file = 'your_word_file.docx'
excel_writer = pd.ExcelWriter('output.xlsx')
extract_tables_from_word(word_file, excel_writer)
excel_writer.save()
阅读全文