import pandas as pd data = pd.read_excel(r'E:\每日数据\MISPOS明细.xlsx',dtype={'商户编号':str,'终端编号':str, '处理情况': str}) rows = data.shape[0] # 获取行数 shape[1]获取列数 department_list = [] for i in range(rows): temp = data["省份"][i] if temp not in department_list: department_list.append(temp) # 将省份的分类存在一个列表中 for department in department_list: new_df = pd.DataFrame() for i in range(0, rows): if data["省份"][i] == department: new_df = pd.concat([new_df, data.iloc[[i], :]], axis=0, ignore_index=True) # 上面的循环效率太低了,这么做太蠢了,其实可以用pandas的条件筛选 new_df = data[(data["省份"] == department) & (data["处理情况"] == "未处理")] # 如果多条件筛选,new_df = data[(data["省份"] == department)&()&()] 括号里写条件用 & 连起来 new_df.to_excel(str(department) + "旧机具未处理明细" + ".xlsx", sheet_name=department, index=False)
时间: 2024-01-14 10:04:46 浏览: 49
详解pandas库pd.read_excel操作读取excel文件参数整理与实例
您好,这段代码是用来实现按照省份将数据进行分类并生成不同的 Excel 文件的。但是在循环部分,您提到循环效率太低,实际上可以使用 Pandas 的条件筛选来实现更高效的筛选。以下是代码修改建议:
```python
import pandas as pd
# 读取数据
data = pd.read_excel(r'E:\每日数据\MISPOS明细.xlsx', dtype={'商户编号':str,'终端编号':str, '处理情况': str})
# 按照省份分类
department_list = data["省份"].unique()
for department in department_list:
new_df = data[(data["省份"] == department) & (data["处理情况"] == "未处理")]
new_df.to_excel(f"{department}旧机具未处理明细.xlsx", sheet_name=department, index=False)
```
这样就可以实现更高效的筛选和处理。同时,为了避免文件名出现中文乱码,建议使用 f-string 来生成文件名。
阅读全文