pypdf2 3.0.0.使用
时间: 2023-12-12 16:02:04 浏览: 232
pypdf2是一个用于操作PDF文件的Python库,它可以用来合并、分割、添加、旋转、水印等操作PDF文件。以下是pypdf2 3.0.0的使用方法:
1. 安装pypdf2
使用pip安装pypdf2:
```
pip install pypdf2
```
2. 打开PDF文件
```python
import PyPDF2
pdf_file = open('example.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
```
这里使用`open`函数打开PDF文件,并以二进制读取模式打开。
3. 读取PDF文件信息
```python
# 获取PDF文件总页数
num_pages = pdf_reader.getNumPages()
print(f'Total pages: {num_pages}')
# 获取PDF文件元信息
pdf_info = pdf_reader.getDocumentInfo()
print(f'Title: {pdf_info.title}')
print(f'Author: {pdf_info.author}')
print(f'Creator: {pdf_info.creator}')
print(f'Producer: {pdf_info.producer}')
print(f'Creation date: {pdf_info['/CreationDate']}')
```
通过`getNumPages`方法可以获取PDF文件的总页数,通过`getDocumentInfo`方法可以获取PDF文件的元信息,例如标题、作者、创建者、生产者、创建日期等。
4. 读取PDF文件内容
```python
# 读取第一页的内容
page = pdf_reader.getPage(0)
text = page.extractText()
print(text)
```
通过`getPage`方法可以获取PDF文件中的某一页,然后使用`extractText`方法可以提取该页的文本内容。
5. 修改PDF文件
```python
# 创建一个新的PDF文件
pdf_writer = PyPDF2.PdfFileWriter()
# 向新文件中添加一页
pdf_writer.addPage(page)
# 将新文件写入磁盘
with open('new.pdf', 'wb') as f:
pdf_writer.write(f)
```
通过`PdfFileWriter`类可以创建一个新的PDF文件,然后使用`addPage`方法向新文件中添加页,最后使用`write`方法将新文件写入磁盘。
6. 关闭文件
```python
pdf_file.close()
```
使用完PDF文件后,需要关闭文件。
阅读全文