读取pdf文件并转换成txt文件python
时间: 2023-09-12 18:13:24 浏览: 108
pdf 读取 并转换成 txt格式
可以使用Python中的第三方库PyPDF2来读取PDF文件,然后使用Python内置的文件操作函数将其转换为txt文件。以下是示例代码:
```
import PyPDF2
# 打开PDF文件
pdf_file = open('example.pdf', 'rb')
# 创建PDF对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 获取PDF中的所有页面
num_pages = pdf_reader.numPages
# 循环读取每个页面的内容
text = ""
for page in range(num_pages):
page_obj = pdf_reader.getPage(page)
text += page_obj.extractText()
# 关闭PDF文件
pdf_file.close()
# 创建TXT文件
txt_file = open('example.txt', 'w')
# 将PDF内容写入TXT文件
txt_file.write(text)
# 关闭TXT文件
txt_file.close()
```
阅读全文