python读取excel,并合并序号重复的数据
时间: 2023-08-28 09:03:26 浏览: 45
可以使用 pandas 库来读取 excel 文件并进行数据合并。具体步骤如下:
1. 安装 pandas 库:在命令行中输入 `pip install pandas`。
2. 导入 pandas 库:在 Python 脚本中输入 `import pandas as pd`。
3. 读取 excel 文件:使用 pandas 库中的 read_excel() 函数读取 excel 文件,如 `df = pd.read_excel('filename.xlsx', sheet_name='Sheet1')`。
4. 合并数据:使用 pandas 库中的 groupby() 函数对数据进行分组,再使用 agg() 函数对每个分组进行聚合操作,如 `df = df.groupby('列名').agg({'序号': 'first', '其他列名1': 'first', '其他列名2': 'first', ...})`。
5. 输出结果:使用 pandas 库中的 to_excel() 函数将合并后的数据输出到 excel 文件中,如 `df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)`。
完整代码如下:
```python
import pandas as pd
# 读取 excel 文件
df = pd.read_excel('filename.xlsx', sheet_name='Sheet1')
# 合并数据
df = df.groupby('列名').agg({'序号': 'first', '其他列名1': 'first', '其他列名2': 'first', ...})
# 输出结果到 excel 文件
df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)
```
其中,`filename.xlsx` 是需要读取的 excel 文件名,`Sheet1` 是需要读取的 worksheet 名称,`列名` 是需要合并的列名,`序号`、`其他列名1`、`其他列名2` 是需要保留的列名,`output.xlsx` 是输出的 excel 文件名。