通过python对excel数据进行去重合并
时间: 2023-05-15 11:07:36 浏览: 184
python 开发的excel 小工具
可以使用 pandas 库来实现对 excel 数据的去重合并操作。具体步骤如下:
1. 使用 pandas 的 read_excel 函数读取 excel 文件,将数据读入到一个 pandas 的 DataFrame 中。
2. 使用 pandas 的 drop_duplicates 函数对 DataFrame 进行去重操作,可以指定哪些列作为去重的依据。
3. 使用 pandas 的 groupby 函数对 DataFrame 进行分组操作,可以指定哪些列作为分组的依据。
4. 使用 pandas 的 agg 函数对每个分组进行聚合操作,可以指定哪些列需要进行聚合,以及聚合函数。
5. 使用 pandas 的 to_excel 函数将处理后的数据写入到一个新的 excel 文件中。
下面是一个示例代码:
```python
import pandas as pd
# 读取 excel 文件
df = pd.read_excel('data.xlsx')
# 去重操作
df = df.drop_duplicates(subset=['列1', '列2'])
# 分组聚合操作
df = df.groupby(['列1', '列2']).agg({'列3': 'sum', '列4': 'mean'})
# 将处理后的数据写入到新的 excel 文件中
df.to_excel('result.xlsx', index=False)
```
注意:需要将代码中的列名替换成实际的列名。
阅读全文