问题需求:需要将路径:C:/Users/xiejin/Desktop/hd 文件夹中的pdf文件名称分别重命名为当前pdf文件内第一页指定坐标的文本内容+原当前pdf名称 针对此需求如何用python3.9实现,尽可能提供一个完整的代码
时间: 2024-01-12 22:03:24 浏览: 85
用python语言进行文件重命名
实现这个需求需要用到 Python 的 `os`、`re`、`PyPDF2` 三个模块。其中 `os` 用于遍历文件夹,`re` 用于匹配文本内容,`PyPDF2` 用于读取 PDF 文件和提取文本内容。
以下是一个示例代码,你可以根据自己的需求进行修改:
```python
import os
import re
import PyPDF2
# 定义 PDF 文件路径和目标文件夹
pdf_folder = 'C:/Users/xiejin/Desktop/hd'
output_folder = 'C:/Users/xiejin/Desktop/new_hd'
# 遍历文件夹中的所有 PDF 文件
for filename in os.listdir(pdf_folder):
if filename.endswith('.pdf'):
# 打开 PDF 文件
pdf_file = open(os.path.join(pdf_folder, filename), 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 提取第一页的文本内容
first_page = pdf_reader.getPage(0)
text_content = first_page.extractText()
# 匹配文本内容中的数字和字母
name_match = re.search(r'\w+', text_content)
if name_match:
new_name = name_match.group() + '_' + filename
new_path = os.path.join(output_folder, new_name)
# 重命名文件
os.rename(os.path.join(pdf_folder, filename), new_path)
print(f'Renamed {filename} to {new_name}')
pdf_file.close()
```
这个代码会读取路径为 `C:/Users/xiejin/Desktop/hd` 的文件夹中的所有 PDF 文件,然后提取每个文件的第一页文本内容,并匹配出其中的数字和字母作为新的文件名。最后将文件重命名为新的文件名并保存到路径为 `C:/Users/xiejin/Desktop/new_hd` 的文件夹中。
阅读全文