python怎么用pdfplumber把pdf批量写入excel,且同一个pdf不需要按页码分开
时间: 2023-11-09 14:42:52 浏览: 155
你可以使用pdfplumber库结合openpyxl库来实现将多个PDF文件的内容批量写入Excel中。下面是一个简单的示例代码:
```python
import pdfplumber
from openpyxl import Workbook
def write_pdf_to_excel(pdf_path, excel_sheet):
with pdfplumber.open(pdf_path) as pdf:
for page in pdf.pages:
text = page.extract_text()
excel_sheet.append([text])
# 假设你有一个包含多个PDF文件路径的列表
pdf_files = ["pdf1.pdf", "pdf2.pdf", "pdf3.pdf"]
# 创建一个新的Excel工作簿
workbook = Workbook()
sheet = workbook.active
for pdf_file in pdf_files:
write_pdf_to_excel(pdf_file, sheet)
# 保存Excel文件
workbook.save("output.xlsx")
```
在上面的代码中,`write_pdf_to_excel` 函数用于将单个PDF文件的文本内容写入Excel的工作表中。然后,我们遍历包含PDF文件路径的列表,对每个PDF文件调用该函数。最后,使用 `workbook.save()` 将Excel文件保存到指定路径。
请注意,上述示例将每个PDF文件的文本内容写入Excel的不同行中。如果你希望将所有PDF文件的内容写入Excel的同一行中,请相应地修改代码逻辑。
阅读全文