出现报错, PageObject' object has no attribute 'extract_words'
时间: 2023-07-14 10:01:51 浏览: 285
非常抱歉,我之前给出的代码有误。确实,PyPDF2库中的`PageObject`对象没有`extract_words`属性。请使用pdfplumber库来提取PDF表格数据。以下是修改后的代码:
```python
import pdfplumber
import openpyxl
def extract_table_from_pdf(pdf_path):
with pdfplumber.open(pdf_path) as pdf:
workbook = openpyxl.Workbook()
sheet = workbook.active
for page in pdf.pages:
table = page.extract_table()
for row in table:
sheet.append(row)
return workbook
# 测试代码
pdf_path = 'example.pdf'
workbook = extract_table_from_pdf(pdf_path)
workbook.save('output.xlsx')
```
在这个示例中,我们使用pdfplumber库打开PDF文件,并使用`extract_table()`方法提取每一页的表格数据。然后,我们将提取的表格数据逐行追加到Excel工作表中,并保存为输出文件。
请确保您已经安装了pdfplumber和openpyxl库。如果您仍然遇到问题,请提供完整的错误消息,以便我可以更好地帮助您解决问题。
阅读全文