用python批量把多个pdf转成word文件
时间: 2023-12-10 13:05:56 浏览: 199
你可以使用Python中的PyPDF2库和docx库来实现将多个PDF文件批量转换为Word文件。以下是一个简单的示例代码:
```python
import os
import PyPDF2
from docx import Document
# 设置PDF文件夹路径和Word文件夹路径
pdf_folder = 'pdf_files'
word_folder = 'word_files'
# 检查Word文件夹是否存在,如果不存在则创建
if not os.path.exists(word_folder):
os.makedirs(word_folder)
# 遍历PDF文件夹中的所有PDF文件
for pdf_file in os.listdir(pdf_folder):
if pdf_file.endswith('.pdf'):
# 打开PDF文件并读取内容
pdf_path = os.path.join(pdf_folder, pdf_file)
pdf_reader = PyPDF2.PdfFileReader(open(pdf_path, 'rb'))
pdf_content = ''
for i in range(pdf_reader.getNumPages()):
pdf_content += pdf_reader.getPage(i).extractText()
# 将PDF内容保存为Word文件
word_path = os.path.join(word_folder, pdf_file[:-4] + '.docx')
document = Document()
document.add_paragraph(pdf_content)
document.save(word_path)
```
这个代码将会遍历指定的PDF文件夹中的所有PDF文件,将每个PDF文件的内容读取出来,然后将其保存为对应的Word文件。请确保你已经安装了PyPDF2和docx库。
阅读全文