何使用python將一張表內當天的內容按照分類並分組呈現出來,並合併到之前的數據表上,其中表有數據'線別','{}效率','{}回流數','{}回流率','效率Total', '回流數Total', '回流率Total',花括號內變量為每天的日期
时间: 2023-09-24 19:09:25 浏览: 37
你可以使用 pandas 库来处理这个任务。首先,读取原始数据表,假设为 df。
```python
import pandas as pd
# 读取原始数据表
df = pd.read_excel('original_data.xlsx')
```
接着,根据日期进行分组,统计每个日期内每个線別的数据,并计算对应的效率、回流数和回流率。
```python
# 根据日期进行分组
grouped = df.groupby('日期')
# 遍历每个组,计算每个線別的数据
for date, group in grouped:
# 计算每个線別的效率、回流数和回流率
group['效率'] = group['产量'] / group['标准工时']
group['回流数'] = group['不良数'] / group['不良率']
group['回流率'] = group['回流数'] / group['产量']
# 将每个線別的数据合并到原始数据表上
df.loc[df['日期'] == date, ['{}效率'.format(date), '{}回流數'.format(date), '{}回流率'.format(date)]] = group[['效率', '回流数', '回流率']].values
# 计算每个日期的总计数据
df['效率Total'] = df.filter(regex='\d+效率').sum(axis=1)
df['回流數Total'] = df.filter(regex='\d+回流數').sum(axis=1)
df['回流率Total'] = df.filter(regex='\d+回流率').sum(axis=1) / len(df.filter(regex='\d+回流率').columns)
```
最后,将处理后的数据表保存到文件中。
```python
# 将处理后的数据表保存到文件中
df.to_excel('processed_data.xlsx', index=False)
```