python使用pdfminer3k读取PDF文档的例子_frompdfminerimportPDFResourceManager - CSDN文库

160 浏览量更新于2023-03-03 评论 1 收藏 64KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

python 使用使用pdfminer3k 读取读取PDF文档的例子文档的例子

1、安装、安装 pdfminer3k

通过pip安装: pip install pdfminer3k

下载安装：在网页 https://pypi.org/project/pdfminer3k/1.3.1/#files 进行下载，解压。然后cmd命令进入到当前文件夹：

可以直接在资源管理器的路径栏直接输入cmd进入到当前目录。然后执行 python setup.py install 等待安装完成

2.读取读取pdf中的中的TXT代码示例：代码示例：

from pdfminer.converter import PDFPageAggregator

from pdfminer.layout import LAParams

from pdfminer.pdfparser import PDFParser, PDFDocument

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter

from pdfminer.pdfdevice import PDFDevice

# 可以使用此方法获取网络上的pdf

from urllib.request import urlopen

fp = urlopen("https://******/articles/800348152163.pdf")

#获取文档对象

#fp = open("****.pdf", "rb")

#创建一个一个与文档关联的解释器

parser = PDFParser(fp)

#PDF文档的对象

doc = PDFDocument()

#连接解释器和文档对象

parser.set_document(doc)

doc.set_parser(parser)

#初始化文档,当前文档没有密码，设为空字符串

doc.initialize("")

#创建PDF资源管理器

resource = PDFResourceManager()

#参数分析器

laparam = LAParams()

#创建一个聚合器

device = PDFPageAggregator(resource, laparams=laparam)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论0

weixin_38691703

粉丝: 2
资源: 961

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈