Traceback (most recent call last): File "D:\Python\程序练习\修改后的程序\解码.py", line 28, in <module> for page in doc.get_pages(): AttributeError: 'PDFDocument' object has no attribute 'get_pages'

如果你使用的是 pdfminer.six，那么代码中应该使用 `PDFPage.get_pages()` 方法来获取 PDF 文件的所有页面。可以修改代码如下： ```python from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfinterp import PDFPageInterpreter, PDFResourceManager from pdfminer.pdfdevice import PDFDevice from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregator from pdfminer.pdfpage import PDFPage # 打开一个 PDF 文件 fp = open('example.pdf', 'rb') # 创建一个 PDF 解析器对象 parser = PDFParser(fp) # 创建一个 PDF 文档对象 doc = PDFDocument(parser) # 创建一个 PDF 资源管理器对象 rsrcmgr = PDFResourceManager() # 创建一个 PDF 设备对象 laparams = LAParams() device = PDFPageAggregator(rsrcmgr, laparams=laparams) # 创建一个 PDF 解释器对象 interpreter = PDFPageInterpreter(rsrcmgr, device) # 处理每一页 for page in PDFPage.get_pages(fp): interpreter.process_page(page) layout = device.get_result() for lt_obj in layout: if hasattr(lt_obj, 'get_text'): print(lt_obj.get_text()) # 关闭 PDF 文件 fp.close() ``` 其中，`PDFPage.get_pages()` 方法可以直接从文件对象中获取 PDF 文件的所有页面，不需要先创建 PDF 文档对象。如果你使用的是 pdfminer3k，那么代码中应该使用 `PDFDocument.get_pages()` 方法来获取 PDF 文件的所有页面。可以修改代码如下： ```python from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfinterp import PDFPageInterpreter, PDFResourceManager from pdfminer.pdfdevice import PDFDevice from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregator # 打开一个 PDF 文件 fp = open('example.pdf', 'rb') # 创建一个 PDF 解析器对象 parser = PDFParser(fp) # 创建一个 PDF 文档对象 doc = PDFDocument(parser) # 创建一个 PDF 资源管理器对象 rsrcmgr = PDFResourceManager() # 创建一个 PDF 设备对象 laparams = LAParams() device = PDFPageAggregator(rsrcmgr, laparams=laparams) # 创建一个 PDF 解释器对象 interpreter = PDFPageInterpreter(rsrcmgr, device) # 处理每一页 for page in doc.get_pages(): interpreter.process_page(page) layout = device.get_result() for lt_obj in layout: if hasattr(lt_obj, 'get_text'): print(lt_obj.get_text()) # 关闭 PDF 文件 fp.close() ``` 其中，`PDFDocument.get_pages()` 方法可以直接从 PDF 文档对象中获取 PDF 文件的所有页面。

Traceback (most recent call last): File "D:\Python\程序练习\修改后的程序\解码.py", line 28, in <module> for page in doc.get_pages(): AttributeError: 'PDFDocument' object has no attribute 'get_pages'

相关推荐

Mac下anaconda中Spyder打开报错Traceback(most recent call last)…问题

Python程序基础：Python中的异常.pptx

traceback-path-mapper:PyCharm无法处理来自远程服务器的回溯。 这是一个简单的脚本，用于修补Python回溯，将远程路径替换为本地路径

Traceback (most recent call last): File "D:\python\pythonProject\atguigu\057000.py", line 23, in <module> print(content) UnicodeEncodeError: 'gbk' codec can't encode character '\x85' in position 0: illegal multibyte sequence

PDF文件头信息： Traceback (most recent call last): File "D:\Python\程序练习\修改后的程序\解析1.py", line 14, in <module> print(f'{key}: {value}') UnicodeEncodeError: 'gbk' codec can't encode character '\xae' in position 20: illegal multibyte sequence

git commi Traceback (most recent call last):

Traceback (most recent call last): File "D:\my_pythonproject\爬虫\dd.py", line 11, in <module> data = process.read() AttributeError: 'bytes' object has no attribute 'read'

Traceback (most recent call last): File "D:\python\230606.py", line 8, in <module> data = response.content.decode('gbk') UnicodeDecodeError: 'gbk' codec can't decode byte 0x99 in position 57: illegal multibyte sequence

Traceback (most recent call last): File "F:\新建文件夹\pythonProject\架包\文件操作.py", line 3, in <module> content= password.read() UnicodeDecodeError: 'gbk' codec can't decode byte 0x9a in position 8: illegal multibyte sequence

Traceback (most recent call last): File "D:\code\pythonProject\python_code\cmp\qrcode.py", line 23, in <module> from pyzbar.pyzbar import decode_gs1 ImportError: cannot import name 'decode_gs1' from 'pyzbar.pyzbar' (D:\python\Lib\site-packages\pyzbar\pyzbar.py)

Traceback (most recent call last): File "D:\python\pythonProject\atguigu\060_urllib_post百度翻译详细翻译.py", line 24, in <module> print(obj) UnicodeEncodeError: 'gbk' codec can't encode character '\u02c8' in position 1146: illegal multibyte sequence

出现了 Traceback (most recent call last): File "C:\Users\cloud\PycharmProjects\pythonProject\venv\a.py", line 3, in <module> content=file.read() UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence

Traceback (most recent call last): File "D:\uir\test\.idea\aaaa.py", line 90, in <module> result =content.replace('\n', '') TypeError: a bytes-like object is required, not 'str'

Exception in thread Thread-3: Traceback (most recent call last): File "threading.py", line 916, in _bootstrap_inner File "threading.py", line 864, in run File "f-s.py", line 102, in start_restruct UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbf in position 0: invalid start byte

debug时显示Traceback (most recent call last): File "D:\PyCharm 2022.2.1\plugins\python\helpers\pydev_pydevd_bundle\pydevd_comm.py", line 304, in _on_run r = r.decode('utf-8') UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 1022-1023: unexpec

Traceback (most recent call last): File "D:\install\python311\2.py", line 41, in <module> plaintext = decoded_bytes.decode() ^^^^^^^^^^^^^^^^^^^^^^ UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 1: invalid start byte

最新推荐

nodejs-x64-0.10.21.tgz

node-v4.1.1-linux-armv6l.tar.xz

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

用matlab绘制高斯色噪声情况下的频率估计CRLB，其中w(n)是零均值高斯色噪声，w(n)=0.8*w(n-1)+e(n)，e(n)服从零均值方差为se的高斯分布

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

python中从Excel中取的列没有了0

traceback-path-mapper:PyCharm无法处理来自远程服务器的回溯。这是一个简单的脚本，用于修补Python回溯，将远程路径替换为本地路径