用python拆分PDF文档 重新命名后输出并保存,其中命名为前缀202306+序号。序号从530号倒序至001号。
时间: 2024-04-07 20:34:01 浏览: 58
python毕业设计&课设-基于BERT+BiLSTM+CRF实现中文命名实体识别(源码+文档)
你可以按照以下方式修改上述示例代码,以实现按照你的要求命名拆分后的PDF文件:
```python
import os
from PyPDF2 import PdfFileReader, PdfFileWriter
def split_pdf(input_path, output_dir):
# 打开PDF文件
with open(input_path, 'rb') as file:
pdf = PdfFileReader(file)
# 获取PDF页数
num_pages = pdf.getNumPages()
# 遍历每一页
for page_num in range(num_pages):
# 创建新的PDF写入对象
pdf_writer = PdfFileWriter()
pdf_writer.addPage(pdf.getPage(page_num))
# 构建新的文件名
serial_number = str(num_pages - page_num).zfill(3)
output_filename = f"202306{serial_number}.pdf"
output_path = os.path.join(output_dir, output_filename)
# 保存拆分后的PDF页
with open(output_path, 'wb') as output_file:
pdf_writer.write(output_file)
# 输入文件路径和输出文件夹路径
input_path = "input.pdf"
output_dir = "output"
# 创建输出文件夹(如果不存在)
if not os.path.exists(output_dir):
os.makedirs(output_dir)
# 拆分PDF并保存
split_pdf(input_path, output_dir)
```
在上述代码中,我们使用`num_pages - page_num`来实现倒序的序号。同时,使用`zfill(3)`来将序号填充为3位数,确保序号有三位数字。按照你的要求,命名格式为"202306"加上序号,例如"202306530.pdf"、"202306529.pdf"等。拆分后的PDF文件将按照倒序的序号顺序命名并保存在指定的输出文件夹中。
阅读全文