python pandas 操作EXCEL 文件 列的相同记录的 代码
时间: 2024-02-03 21:11:48 浏览: 66
Python pandas对excel的操作实现示例
假设你有一个 Excel 文件 `data.xlsx`,其中包含一个名为 `Sheet1` 的工作表,该工作表包含以下数据:
| Name | Age | Gender |
|------|-----|--------|
| John | 25 | M |
| Mary | 30 | F |
| Tom | 28 | M |
| John | 22 | M |
| Mary | 32 | F |
如果你想找到具有相同名称的记录并将它们组合在一起,可以使用 pandas 库。以下是实现的代码:
```python
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
# 找到具有相同名称的记录并将它们组合在一起
grouped = df.groupby('Name')['Age', 'Gender'].apply(lambda x: x.values.tolist())
# 将结果保存到新的 Excel 文件中
result = pd.DataFrame(grouped, columns=['Records'])
result.to_excel('result.xlsx', index=False)
```
上述代码将根据 `Name` 列对记录进行分组,并将每个组中的 `Age` 和 `Gender` 列的值组合在一起。结果将保存在名为 `result.xlsx` 的新 Excel 文件中,其中每个记录都表示为一个列表。
输出结果:
| Records |
|------------------------|
| [[25, 'M'], [22, 'M']] |
| [[30, 'F'], [32, 'F']] |
| [[28, 'M']] |
阅读全文