利用python根据Excel表格中的公司名称和年份筛选出文件中所有满足条件的PDF文件
时间: 2024-02-15 08:02:23 浏览: 65
基于python实现在Excel中按条件筛选数据并存入新的表
好的,您可以使用Python中的pandas和os模块来实现这个功能。
首先,您需要安装pandas和openpyxl模块。您可以使用以下命令来安装它们:
```
pip install pandas openpyxl
```
接下来,您可以使用以下代码来读取Excel文件并获取所需的公司名称和年份:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('文件名.xlsx')
# 获取公司名称和年份
company_name = 'ABC公司'
year = 2021
# 根据条件筛选
filtered_df = df[(df['公司名称'] == company_name) & (df['年份'] == year)]
```
接下来,您可以使用以下代码来遍历文件夹中的所有PDF文件,并将满足条件的文件复制到另一个文件夹中:
```python
import os
import shutil
# PDF文件夹路径
pdf_dir = 'PDF文件夹路径'
# 目标文件夹路径
target_dir = '目标文件夹路径'
# 遍历PDF文件夹中的所有文件
for filename in os.listdir(pdf_dir):
# 获取文件路径
filepath = os.path.join(pdf_dir, filename)
# 检查是否是PDF文件
if filename.endswith('.pdf'):
# 检查是否满足条件
if filtered_df['文件名'].str.contains(filename).any():
# 复制文件到目标文件夹中
shutil.copy(filepath, os.path.join(target_dir, filename))
```
这样,您就可以根据Excel表格中的公司名称和年份筛选出文件中所有满足条件的PDF文件了。
阅读全文