使用python批量将PDF转成TXT,并且不改变命名
时间: 2023-06-01 18:03:25 浏览: 472
以下是使用Python将PDF文件批量转换为TXT文件的示例代码:
```python
import os
import glob
import PyPDF2
# 设置PDF文件夹路径和TXT文件夹路径
pdf_folder = 'path/to/pdf/folder'
txt_folder = 'path/to/txt/folder'
# 获取PDF文件夹中所有PDF文件的路径
pdf_files = glob.glob(os.path.join(pdf_folder, '*.pdf'))
for pdf_file in pdf_files:
# 获取PDF文件名(不包括扩展名)
pdf_filename = os.path.splitext(os.path.basename(pdf_file))[0]
# 设置TXT文件路径
txt_file = os.path.join(txt_folder, pdf_filename + '.txt')
# 打开PDF文件并创建PDF阅读器对象
with open(pdf_file, 'rb') as pdf:
reader = PyPDF2.PdfFileReader(pdf)
# 获取PDF文件中所有页面的文本
text = '\n\n'.join(page.extractText() for page in reader.pages)
# 将文本写入TXT文件
with open(txt_file, 'w', encoding='utf-8') as txt:
txt.write(text)
```
这段代码通过使用PyPDF2库打开PDF文件并创建PDF阅读器对象,然后获取PDF文件中所有页面的文本,并将文本写入TXT文件。最后,它将保留原始PDF文件名,只是将扩展名更改为.txt。您可以根据需要更改文件夹路径和文件扩展名。
阅读全文