首页Python提取pdf中的图片

Python提取pdf中的图片

时间: 2023-12-01 19:04:59 浏览: 104

要提取PDF中的图片，可以使用Python的PyPDF2和Pillow库。以下是一个示例代码： ```python import PyPDF2 from PIL import Image pdf_file = open('example.pdf', 'rb') pdf_reader = PyPDF2.PdfFileReader(pdf_file) for page_num in range(pdf_reader.numPages): page = pdf_reader.getPage(page_num) xObject = page['/Resources']['/XObject'].getObject() for obj in xObject: if xObject[obj]['/Subtype'] == '/Image': size = (xObject[obj]['/Width'], xObject[obj]['/Height']) data = xObject[obj].getData() mode = "" if xObject[obj]['/ColorSpace'] == '/DeviceRGB': mode = "RGB" else: mode = "P" image = Image.frombytes(mode, size, data) image.save(obj + ".jpg", "JPEG") ``` 这个代码会遍历PDF文件中的所有页面，提取出其中的图片并保存为JPEG格式的文件。你需要将代码中的`example.pdf`替换成你要提取图片的PDF文件名。

阅读全文