python获取excel数据,分别是车间号,取样时间,样品类型,检验结果,备注,先按照车间号进行分组,每组数据再按照样品类型分组,计算每组数据检验结果为合格的占比,结果以百分比显示,再计算每组数据备注含有脱镀字符的占比,再计算每组数据备注含有破断低字符的占比,再计算每组数据备注含有颗粒多字符的占比,再计算每组数据备注含有颗粒少字符的占比,再计算每组数据备注含有团聚字符的占比,均以百分比显示,输出一个表格到excel
时间: 2023-06-07 15:09:29 浏览: 117
获取沪深300日行情数据并存入Excel文件_300_excel获取_python_数据开发_wind_
5星 · 资源好评率100%
很高兴为您解答关于Python处理Excel数据的问题。下面是我的回答:
首先,您需要使用Python中的pandas库读取Excel文件,并用groupby方法对数据进行分组。然后,您可以使用agg方法来计算每个分组内数据的占比,过滤含有特定字符的备注信息,并将结果以百分比显示。
以下是一个示例代码:
```
import pandas as pd
# 读取Excel文件
df = pd.read_excel('your_excel_file.xlsx')
# 按车间号和样品类型分组
grouped = df.groupby(['车间号', '样品类型'])
# 计算检验结果合格占比并重命名列名
result_pct = grouped.agg({'检验结果': lambda x: sum(x == '合格') / len(x) * 100}).rename(columns={'检验结果': '检验结果合格占比'})
# 筛选出包含特定字符的备注,并计算占比
def count_pct_with_keyword(keyword):
return grouped.agg({'备注': lambda x: sum(x.str.contains(keyword)) / len(x) * 100}).rename(columns={'备注': f'备注含有{keyword}占比'})
keyword_list = ['脱离', '破断低', '颗粒多', '颗粒少', '团聚']
remarks_pct = pd.concat([count_pct_with_keyword(keyword) for keyword in keyword_list], axis=1)
# 合并结果并输出到Excel文件
result = pd.concat([result_pct, remarks_pct], axis=1)
result.to_excel('output_file.xlsx', index=True)
```
请注意,具体数据处理方式可能因您的Excel数据格式略有不同而有所调整。
阅读全文