import pandas as pdimport datetime now = datetime.datetime.now().strftime('%Y%m%d') # 获取当前日期,格式为年月日 data = pd.read_excel(r'E:\每日数据\MISPOS明细.xlsx',dtype={'商户编号':str,'终端编号':str, '处理情况': str}) rows = data.shape[0] # 获取行数 shape[1]获取列数 department_list = [] for i in range(rows): temp = data["省份"][i] if temp not in department_list: department_list.append(temp) # 将省份的分类存在一个列表中 for department in department_list: new_df = pd.DataFrame() for i in range(0, rows): if data["省份"][i] == department: new_df = pd.concat([new_df, data.iloc[[i], :]], axis=0, ignore_index=True) # 上面的循环效率太低了,这么做太蠢了,其实可以用pandas的条件筛选 new_df = data[(data["省份"] == department) & (data["处理情况"] == "未处理")] # 如果多条件筛选,new_df = data[(data["省份"] == department)&()&()] 括号里写条件用 & 连起来 new_df.to_excel(str(department) +"旧机具未处理明细" + ".xlsx", sheet_name=department, index=False)
时间: 2024-01-16 12:02:59 浏览: 75
python时间日期函数与利用pandas进行时间序列处理详解
5星 · 资源好评率100%
这段代码的作用是读取一个名为'MISPOS明细.xlsx'的Excel文件,根据省份将数据分类,并将每个省份的未处理数据保存为一个新的Excel文件。具体流程如下:
1. 首先导入pandas和datetime模块,并使用datetime模块获取当前日期并将格式转化为年月日的形式。
2. 使用pandas的read_excel()函数读取名为'MISPOS明细.xlsx'的Excel文件,并指定'商户编号'、'终端编号'和'处理情况'列的数据类型为字符串。
3. 使用data.shape[0]获取数据的行数,再用一个循环将所有不同的省份存在一个列表中。
4. 对于每一个省份,使用data[(data["省份"] == department) & (data["处理情况"] == "未处理")]的条件筛选方式获取该省份的未处理数据,并将结果保存为一个新的Excel文件,文件名为该省份的名称加上'旧机具未处理明细'。
需要注意的是,代码中存在一些不必要的循环和拼接操作,可以使用pandas的更高效的操作来实现相同的功能。另外,该代码并没有处理异常情况,需要在实际使用中注意。
阅读全文