import PyPDF2 # 打开PDF文件 pdf_file = open('D:\test_report.pdf', 'rb') pdf_reader = PyPDF2.PdfReader(pdf_file) num_pages = pdf_reader.numPages for page in range(num_pages): # 获取当前页面 current_page = pdf_reader.getPage(page) # 提取文字 text = current_page.extract_text() # 打印文字 print(text) pdf_file.close() 代码哪里有问题
时间: 2024-04-13 11:30:54 浏览: 130
Python利用PyPDF2库获取PDF文件总页码实例
你的代码基本上是正确的,但是在文件路径中有一个小问题。在字符串中,反斜杠(`\`)在Python中是一个转义字符。因此,在Windows路径中,你需要使用双反斜杠(`\\`)或原始字符串(在字符串前加上`r`)来避免转义。请修改以下代码行:
```python
pdf_file = open('D:\\test_report.pdf', 'rb')
```
或者使用原始字符串:
```python
pdf_file = open(r'D:\test_report.pdf', 'rb')
```
这样就可以正确打开PDF文件了。如果你的PDF文件路径仍然存在问题,请确保文件路径是正确的,并且确保文件存在。
阅读全文