首页出现报错， PageObject' object has no attribute 'extract_words'

出现报错， PageObject' object has no attribute 'extract_words'

时间: 2023-07-14 18:01:51 浏览: 328

非常抱歉，我之前给出的代码有误。确实，PyPDF2库中的`PageObject`对象没有`extract_words`属性。请使用pdfplumber库来提取PDF表格数据。以下是修改后的代码： ```python import pdfplumber import openpyxl def extract_table_from_pdf(pdf_path): with pdfplumber.open(pdf_path) as pdf: workbook = openpyxl.Workbook() sheet = workbook.active for page in pdf.pages: table = page.extract_table() for row in table: sheet.append(row) return workbook # 测试代码 pdf_path = 'example.pdf' workbook = extract_table_from_pdf(pdf_path) workbook.save('output.xlsx') ``` 在这个示例中，我们使用pdfplumber库打开PDF文件，并使用`extract_table()`方法提取每一页的表格数据。然后，我们将提取的表格数据逐行追加到Excel工作表中，并保存为输出文件。请确保您已经安装了pdfplumber和openpyxl库。如果您仍然遇到问题，请提供完整的错误消息，以便我可以更好地帮助您解决问题。

阅读全文