写一段python代码,批量读取pdf文件的创作者信息
时间: 2023-02-07 22:57:20 浏览: 140
好的,首先你需要安装 Python 第三方库 `PyPDF2`。你可以使用如下代码来安装它:
```python
pip install pypdf2
```
然后,你可以使用如下代码来批量读取 PDF 文件的创作者信息:
```python
import os
import PyPDF2
# 定义 PDF 文件的路径
path = '/path/to/pdf/files'
# 获取所有 PDF 文件的文件名
pdf_files = [f for f in os.listdir(path) if f.endswith('.pdf')]
# 遍历所有 PDF 文件
for pdf_file in pdf_files:
# 打开 PDF 文件
with open(os.path.join(path, pdf_file), 'rb') as f:
# 读取 PDF 文件的信息
pdf_reader = PyPDF2.PdfFileReader(f)
# 获取 PDF 文件的创作者信息
author = pdf_reader.getDocumentInfo().author
# 输出 PDF 文件的创作者信息
print(f'Author of {pdf_file}: {author}')
```
在上面的代码中,我们首先获取了所有 PDF 文件的文件名,然后遍历这些文件名,依次打开每一个 PDF 文件,读取文件的信息,获取创作者信息,最后输出创作者信息。
希望这些内容能帮到你!
阅读全文