我想读取"我想读取“D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf”这个PDF的内容,把读取的内容合并成一个字符串,然后用中文句号进行分割,一个句号视为一句,把分割的每句话都一一打印出来,请问用python如何实现,请给我2个不同的实现方法,不要用pypdf2,不要用pdfminer库
时间: 2023-06-19 15:04:18 浏览: 40
方法一:使用PyMuPDF库
1. 安装PyMuPDF库
可以使用以下命令进行安装:
```
pip install PyMuPDF
```
2. 读取PDF内容并分割句子
以下是代码实现:
```python
import fitz # PyMuPDF库
# 打开PDF文件
doc = fitz.open(r"D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf")
text = "" # 存储PDF内容的字符串
for page in doc:
text += page.getText()
# 将文本按照中文句号分割成句子
sentences = text.split("。")
# 打印每一句
for sentence in sentences:
print(sentence.strip() + "。")
```
方法二:使用pdfplumber库
1. 安装pdfplumber库
可以使用以下命令进行安装:
```
pip install pdfplumber
```
2. 读取PDF内容并分割句子
以下是代码实现:
```python
import pdfplumber
# 打开PDF文件
with pdfplumber.open(r"D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf") as pdf:
text = "" # 存储PDF内容的字符串
for page in pdf.pages:
text += page.extract_text()
# 将文本按照中文句号分割成句子
sentences = text.split("。")
# 打印每一句
for sentence in sentences:
print(sentence.strip() + "。")
```