PdfFileReader is deprecated and was removed in PyPDF2 3.0.0
时间: 2024-01-06 11:15:07 浏览: 62
是的,`PdfFileReader` 确实已经在 PyPDF2 3.0.0 中被弃用,并且在 PyPDF4 中重新实现了。如果您使用的是 PyPDF2 3.0.0 或更高版本,您可以将代码中的 `PdfFileReader` 替换为 `PdfFileMerger`。
以下是修正后的代码:
```
import PyPDF4
import pandas as pd
# 打开PDF文件并获取第一页
pdf_file = open('1.pdf', 'rb')
pdf_reader = PyPDF4.PdfFileReader(pdf_file)
page = pdf_reader.getPage(0)
# 将PDF页面转换为文本
page_text = page.extractText()
# 将文本数据转换为表格数据
table_data = []
for row in page_text.strip().split('\n'):
table_data.append([cell.strip() for cell in row.split()])
# 将表格数据转换为pandas DataFrame
df = pd.DataFrame(table_data[1:], columns=table_data[0])
# 将DataFrame输出到Excel文件
df.to_excel('example.xlsx', index=False)
```
这段代码可以打开名为 `1.pdf` 的 PDF 文件,读取第一页中的表格数据,并将其转换为 pandas 的 DataFrame 格式,最后将 DataFrame 输出到名为 `example.xlsx` 的 Excel 文件中。请确保您已经安装了 PyPDF4 和 pandas 库。
阅读全文