使用pymupdf提取pdf中的特定页面并单独保成一个pdf文件
时间: 2023-05-30 18:04:37 浏览: 285
python 爬取网页内容并保存为pdf格式
以下是使用pymupdf库在Python中提取pdf中的特定页面并单独保存为一个pdf文件的示例代码:
```python
import fitz
# 打开pdf文件并获取页面数量
pdf_doc = fitz.open("example.pdf")
num_pages = pdf_doc.page_count
# 提取第3页并保存为新的pdf文件
output = fitz.open()
output.insert_pdf(pdf_doc, from_page=2, to_page=2)
output.save("output.pdf")
output.close()
# 关闭pdf文件
pdf_doc.close()
```
在上面的代码中,我们打开了一个名为“example.pdf”的pdf文件,并使用`fitz.open()`函数将其打开。然后,我们使用`pdf_doc.page_count`获取页面数量。
接下来,我们使用`fitz.open()`函数创建一个新的pdf文件,并使用`output.insert_pdf()`方法从原始pdf文件中提取第3页(从索引2开始)并将其插入到新的pdf文件中。然后,我们使用`output.save()`方法将新的pdf文件保存为“output.pdf”并关闭它。
最后,我们使用`pdf_doc.close()`方法关闭原始pdf文件。
阅读全文