在输出excel前,先删除已经存在下excel
时间: 2023-07-07 21:27:32 浏览: 35
你可以使用 `os` 模块中的 `path.exists` 方法来检查文件是否存在,并使用 `os.remove` 方法删除文件。修改后的代码如下:
```python
import os
import PyPDF4
import pandas as pd
# 指定输出的 Excel 文件名
excel_file = 'example.xlsx'
# 如果文件已经存在,先删除文件
if os.path.exists(excel_file):
os.remove(excel_file)
# 打开 PDF 文件并获取第一页
pdf_file = open('1.pdf', 'rb')
pdf_reader = PyPDF4.PdfFileReader(pdf_file)
page = pdf_reader.getPage(0)
# 将 PDF 页面转换为文本
page_text = page.extractText()
# 将文本数据转换为表格数据
table_data = []
for row in page_text.strip().split('\n'):
table_data.append([cell.strip() for cell in row.split()])
# 将表格数据转换为 pandas DataFrame
df = pd.DataFrame(table_data[1:], columns=table_data[0])
# 将 DataFrame 输出到 Excel 文件
df.to_excel(excel_file, index=False)
```
这样,如果文件已经存在,就会先删除文件,再重新生成新的 Excel 文件。