对保存在E:\Test\Test\Test内的所有EXCEL表格进行处理,如何从日期这一列中筛选出以2012开头的行,并将日期这一列包含2012的数据全部删除并保存到新的excel表中
时间: 2024-02-18 10:00:50 浏览: 54
您可以使用Python中的pandas库来完成这个任务。首先,您需要安装pandas库。安装完成后,您可以使用以下代码来实现您的要求:
```python
import pandas as pd
import os
# 设置文件夹路径
folder_path = r'E:\Test\Test\Test'
# 获取文件夹中的所有Excel文件
excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 遍历所有Excel文件,并处理其中的日期列
for file in excel_files:
# 读取Excel文件
df = pd.read_excel(os.path.join(folder_path, file))
# 筛选出日期列中以2012开头的行
mask = df['日期'].astype(str).str.startswith('2012')
# 删除日期列中包含2012的数据
df = df.loc[~mask]
# 保存处理后的数据到新的Excel文件中
new_file_name = 'new_' + file
new_file_path = os.path.join(folder_path, new_file_name)
df.to_excel(new_file_path, index=False)
```
上述代码会遍历指定文件夹中的所有Excel文件,并对其中的日期列进行处理。处理后的数据会保存到新的Excel文件中,文件名以'new_'开头。如果您需要修改日期列的名称,可以将上述代码中的'日期'替换为您实际使用的列名。