首页使用 python将文件夹所有子目录下的 PDF 文件转换为图片的脚本

使用 python将文件夹所有子目录下的 PDF 文件转换为图片的脚本

时间: 2024-09-25 07:04:22 浏览: 38

在Python中，我们可以使用`pdfplumber`库读取PDF文件，并结合`PIL`（Pillow）库来将其转换为图片。以下是一个基本的示例脚本，它会递归遍历指定目录及其所有子目录中的PDF文件，并将它们转换为PNG图片： ```python import os import pdfplumber from PIL import Image # 定义转换函数 def convert_pdf_to_image(pdf_path, img_dir): # 创建图片保存路径 if not os.path.exists(img_dir): os.makedirs(img_dir) with pdfplumber.open(pdf_path) as pdf: for page_num in range(len(pdf.pages)): page = pdf.pages[page_num] image_data = page.extract_text() # 获取页面文本作为占位 img = Image.new('RGB', (page.width, page.height), color='white') # 创建空白图片 draw = ImageDraw.Draw(img) font = ImageFont.truetype("arial.ttf", size=12) # 设置字体 draw.text((5, 5), image_data, fill=(0, 0, 0), font=font) # 写入文本 img.save(os.path.join(img_dir, f"page_{page_num}.png")) # 要转换的根目录 root_dir = "your_directory_containing_pdfs" # 遍历根目录及其子目录 for root, dirs, files in os.walk(root_dir): for file in files: if file.endswith(".pdf"): # 构建完整PDF文件路径 pdf_file = os.path.join(root, file) # 生成对应目录保存图片 img_dir = os.path.join(root, "images_from_" + os.path.basename(root)) convert_pdf_to_image(pdf_file, img_dir)

阅读全文