我想读取"我想读取“D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf”这个PDF的内容,把读取的内容合并成一个字符串,然后用中文或英文句号进行分割,把分割的结果打印出来,用python,不用pypdf2库
时间: 2023-06-17 07:06:06 浏览: 98
Python-PyPDF2一个可以分割合并和转换PDF文件的Python库
好的,你可以使用Python中的PyMuPDF库来实现这个功能。以下是代码:
```python
import fitz
# 读取PDF文件
doc = fitz.open(r"D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf")
# 定义一个空字符串来存储读取的内容
text = ""
# 读取每一页的内容并添加到字符串中
for page in doc:
text += page.getText()
# 用中文或英文句号进行分割
text = text.replace('\n', '') # 去掉换行符
text = text.replace('\r', '') # 去掉回车符
text = text.replace(' ', '') # 去掉空格
text = text.replace('。', '。\n') # 中文句号
text = text.replace('. ', '.\n') # 英文句号
# 打印分割结果
print(text)
```
这个程序会读取指定路径下的PDF文件,并把每一页的内容合并成一个字符串。然后,它会用中文或英文句号进行分割,并把分割的结果打印出来。
阅读全文