python可以把pdf转成txt吗?
时间: 2023-10-01 14:06:00 浏览: 82
将pdf转换成txt
5星 · 资源好评率100%
是的,Python可以将PDF转换为纯文本格式(TXT)。你可以使用第三方库,例如PyPDF2或pdfminer。下面是使用PyPDF2库将PDF文件转换为纯文本的示例代码:
```python
import PyPDF2
# 打开PDF文件
pdf_file = open('example.pdf', 'rb')
# 创建PDF阅读器对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 读取PDF文件中的所有页面并将其合并为一个字符串
pdf_text = ''
for page in pdf_reader.pages:
pdf_text += page.extract_text()
# 关闭PDF文件
pdf_file.close()
# 将PDF文本写入新的TXT文件
txt_file = open('example.txt', 'w', encoding='utf-8')
txt_file.write(pdf_text)
txt_file.close()
```
请注意,PDF文件中的文本可能会出现格式错误或乱码,这取决于PDF文件的质量和格式。如果你遇到此类问题,请尝试使用其他PDF转换工具或手动编辑TXT文件。
阅读全文