怎么按分公司汇总各sheet数据并生成新表格
时间: 2024-12-23 13:21:20 浏览: 3
如果你想按分公司汇总来自不同工作表的数据,并将其合并到一个新的表格中,可以采用类似下面的步骤,假设数据在Excel工作表中,并且有一个名为"Division"的列标识分公司的信息:
1. **导入必要的库**:
首先,你需要`pandas`库来处理Excel数据:
```python
import pandas as pd
```
2. **打开Excel文件**:
使用`pandas`的`read_excel`函数读取Excel文件:
```python
excel_file = pd.ExcelFile('yourfile.xlsx')
```
3. **获取所有工作表名称**:
获取所有工作表名称:
```python
sheet_names = excel_file.sheet_names
```
4. **遍历工作表,按分公司汇总**:
创建一个空的DataFrame用于存储汇总结果:
```python
summary_df = pd.DataFrame()
for sheet_name in sheet_names:
df = pd.read_excel(excel_file, sheet_name)
division_series = df['Division']
grouped = df.groupby(division_series)
for name, group in grouped:
new_row = {'Division': name, 'Data': group.iloc[0].to_dict()} # 这里假设你想要汇总的第一列是重要的指标
summary_df = summary_df.append(new_row, ignore_index=True)
```
5. **检查和调整数据格式**:
确保所有的汇总数据已正确添加,并清理不需要的重复项:
```python
summary_df.drop_duplicates(inplace=True)
```
6. **保存结果**:
将汇总后的数据保存为新的Excel或CSV文件:
```python
summary_df.to_excel('new_summary.xlsx', index=False) # 保存为Excel
summary_df.to_csv('new_summary.csv', index=False) # 或者保存为CSV
```
阅读全文