import fitz # PyMuPDF库 # 打开PDF文件 doc = fitz.open(r"D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf") text = "" # 存储PDF内容的字符串 for page in doc: text += page.getText() # 将文本按照中文句号分割成句子 sentences = text.split("。") # 打印每一句 for sentence in sentences: print(sentence.strip() + "。")我的代码报错,显示AttributeError: 'Page' object has no attribute 'getText'我该如何修改
时间: 2023-06-19 19:04:13 浏览: 149
使用pymupdf库拆分PDF文件的源代码
你可以将`page.getText()` 改为 `page.get_text()`, 也就是将 `getText()` 方法改为 `get_text()` 方法,即:
```
import fitz
# 打开PDF文件
doc = fitz.open(r"D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf")
text = "" # 存储PDF内容的字符串
for page in doc:
text += page.get_text() # 将文本按照中文句号分割成句子
sentences = text.split("。") # 打印每一句
for sentence in sentences:
print(sentence.strip() + "。")
```
这样应该就能够正确地获取PDF中的文本并分割成句子了。
阅读全文