利用python根据Excel表格中的公司名称和年份筛选出文件中所有满足条件的PDF文件
时间: 2024-02-15 07:02:18 浏览: 70
python批量提取PDF中的表格到Excel文档
可以使用Python的pandas和os模块完成这个任务。以下是一个基本的示例代码:
```python
import pandas as pd
import os
# 读取Excel表格
df = pd.read_excel('file.xlsx')
# 获取所有PDF文件
pdf_files = [f for f in os.listdir() if f.endswith('.pdf')]
# 根据公司名称和年份筛选文件
for index, row in df.iterrows():
company = row['公司名称']
year = row['年份']
for file in pdf_files:
if company in file and str(year) in file:
print(file)
```
在这个示例中,我们首先使用pandas读取Excel表格。然后,我们使用os模块获取所有PDF文件的列表。接下来,我们使用一个循环来遍历Excel表格中的每一行,并在pdf_files列表中查找满足条件的文件。如果找到了匹配的文件,就打印出文件名。你可以根据自己的需求进一步修改代码。
阅读全文