用Python写一段代码,读取xlsx表格中b列的数据,把相同数据的记录提取出来,并且按照a列中的序号按顺序排列
时间: 2023-11-28 22:47:51 浏览: 106
Python一键提取PDF中的表格到Excel
假设我们要读取的 Excel 文件名为 `sample.xlsx`,其中有两列数据,分别为 `a` 和 `b`。我们可以使用 `pandas` 库来完成这个任务,代码如下:
```python
import pandas as pd
# 读取 Excel 文件中的数据
df = pd.read_excel('sample.xlsx')
# 按照 b 列中的值进行分组
groups = df.groupby('b')
# 遍历分组结果
for b, group in groups:
# 按照 a 列中的序号进行排序
group = group.sort_values(by='a')
# 输出分组结果
print(f"b={b}")
print(group)
```
在上述代码中,我们首先使用 `pandas` 库的 `read_excel` 函数读取 Excel 文件中的数据,并将其存储在一个 `DataFrame` 中。然后,我们使用 `groupby` 函数按照 `b` 列中的值进行分组,得到一个以 `b` 列中的值为键,以相同值所在行为值的字典。最后,我们对于每个分组,按照 `a` 列中的序号进行排序,并输出分组结果。
阅读全文