如何用PyPDF2分割pdf
时间: 2023-06-13 10:08:56 浏览: 179
Python中通过PyPDF2实现PDF拆分
PyPDF2是一个Python库,用于操作PDF文件。要使用PyPDF2分割PDF文件,可以使用以下步骤:
1. 安装PyPDF2库,可以使用以下命令进行安装:
```
pip install PyPDF2
```
2. 导入PyPDF2库:
```python
import PyPDF2
```
3. 打开要拆分的PDF文件,可以使用以下代码:
```python
pdf_file = open('example.pdf', 'rb') # 'rb'是以二进制读取模式打开
```
4. 创建一个PDF阅读器对象:
```python
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
```
5. 获取PDF文件的页数:
```python
num_pages = pdf_reader.getNumPages()
```
6. 循环遍历每一页,将每一页保存到一个新的PDF文件中:
```python
for page in range(num_pages):
# 创建一个PDF写入对象
pdf_writer = PyPDF2.PdfFileWriter()
# 将当前页添加到PDF写入对象中
pdf_writer.addPage(pdf_reader.getPage(page))
# 创建一个新的PDF文件
output_file = open(f'page_{page+1}.pdf', 'wb') # 'wb'是以二进制写入模式打开
# 将PDF写入对象中的内容写入到新的PDF文件中
pdf_writer.write(output_file)
# 关闭新的PDF文件
output_file.close()
```
完整的代码示例:
```python
import PyPDF2
# 打开要拆分的PDF文件
pdf_file = open('example.pdf', 'rb')
# 创建一个PDF阅读器对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 获取PDF文件的页数
num_pages = pdf_reader.getNumPages()
# 循环遍历每一页,将每一页保存到一个新的PDF文件中
for page in range(num_pages):
# 创建一个PDF写入对象
pdf_writer = PyPDF2.PdfFileWriter()
# 将当前页添加到PDF写入对象中
pdf_writer.addPage(pdf_reader.getPage(page))
# 创建一个新的PDF文件
output_file = open(f'page_{page+1}.pdf', 'wb') # 'wb'是以二进制写入模式打开
# 将PDF写入对象中的内容写入到新的PDF文件中
pdf_writer.write(output_file)
# 关闭新的PDF文件
output_file.close()
# 关闭原始的PDF文件
pdf_file.close()
```
该示例代码将会把原始的PDF文件拆分成多个单页的PDF文件,每个文件保存在当前工作目录下,文件名为`page_1.pdf`、`page_2.pdf`、`page_3.pdf`等。
阅读全文