帮我用python写一个自动提取pdf文件名称的代码
时间: 2024-04-15 07:29:07 浏览: 270
python提取pdf文件目录.zip
当然,我可以帮你编写一个Python代码来自动提取PDF文件名称。你可以使用`PyPDF2`库来实现这个功能。请确保你已经安装了`PyPDF2`库。
下面是一个示例代码:
```python
import PyPDF2
import os
def extract_pdf_filename(pdf_path):
with open(pdf_path, 'rb') as file:
pdf_reader = PyPDF2.PdfFileReader(file)
pdf_info = pdf_reader.getDocumentInfo()
return pdf_info.title
# 用于存储提取的PDF文件名
pdf_filenames = []
# PDF文件所在的文件夹路径
pdf_folder = '/path/to/pdf_folder'
# 遍历文件夹中的所有PDF文件
for filename in os.listdir(pdf_folder):
if filename.endswith('.pdf'):
pdf_path = os.path.join(pdf_folder, filename)
pdf_filename = extract_pdf_filename(pdf_path)
pdf_filenames.append(pdf_filename)
# 打印提取的PDF文件名
for filename in pdf_filenames:
print(filename)
```
在上面的代码中,我们首先定义了一个`extract_pdf_filename`函数,它接收一个PDF文件路径作为参数,并使用`PyPDF2`库提取PDF文件的标题信息,并将其作为函数的返回值。
然后,在主代码中,我们指定了存储提取的PDF文件名的列表`pdf_filenames`,并指定了包含PDF文件的文件夹路径`pdf_folder`。我们使用`os.listdir`函数遍历文件夹中的所有文件,并检查是否是以`.pdf`为扩展名的PDF文件。对于每个找到的PDF文件,我们调用`extract_pdf_filename`函数来提取其文件名,并将其添加到`pdf_filenames`列表中。
最后,我们打印出提取的PDF文件名。
请记得将`/path/to/pdf_folder`替换为你实际的PDF文件夹路径。如果你的PDF文件有密码保护,你可能需要提供密码才能成功读取PDF文件的标题信息。
阅读全文