使用pdfplumber把pdf文档转化为文本保存
时间: 2023-02-11 20:07:23 浏览: 180
专门用于测试的资源,Python用pdfplumber第三方库读取pdf文件写入到Excel表中
5星 · 资源好评率100%
可以使用 Python 库 pdfplumber 将 PDF 文档转换为文本并保存。首先,需要安装 pdfplumber,可以使用 pip 安装:
```python
pip install pdfplumber
```
然后,使用 pdfplumber 打开 PDF 文档:
```python
import pdfplumber
with pdfplumber.open("document.pdf") as pdf:
# do something with the pdf
```
接着,可以遍历每一页并获取其文本:
```python
for page in pdf.pages:
text = page.extract_text()
# do something with the text
```
最后,将文本保存到文件中
```python
with open("document.txt", "w") as f:
f.write(text)
```
其中文件名称和写入的文件名可以自己更改.
阅读全文