python提取桌面测试文件夹内的word表格信息保存到excel中
时间: 2023-06-12 19:01:55 浏览: 180
python实现:提取word文件中的表格到excel中
可以使用Python中的pandas和docx库来提取桌面测试文件夹内的word表格信息保存到excel中。首先,使用docx库打开word文件,然后使用pandas库将表格数据读取为数据框,最后将数据框保存为excel文件。
下面是示例代码:
```python
import os
import pandas as pd
import docx
# 获取桌面测试文件夹路径
desktop_path = os.path.expanduser("~/Desktop/test_folder")
# 获取所有word文件路径
files = [os.path.join(desktop_path, f) for f in os.listdir(desktop_path) if f.endswith('.docx')]
# 循环读取word文件中表格信息并保存为excel文件
for file in files:
# 打开word文档
doc = docx.Document(file)
# 遍历文档中所有表格
for table in doc.tables:
# 将每个表格数据读取为数据框
data = [[cell.text for cell in row.cells] for row in table.rows]
df = pd.DataFrame(data[1:], columns=data[0])
# 保存为excel文件
excel_path = os.path.join(desktop_path, f"{table.title}.xlsx")
df.to_excel(excel_path, index=False)
```
这段代码会遍历桌面测试文件夹中所有的word文件,将每个文件中的所有表格分别读取为数据框,并保存为以表格标题为文件名的excel文件。
阅读全文