python从excel表中筛选出每行的重复3次的数据,并标记行所在行
时间: 2023-06-25 16:03:47 浏览: 193
python实现查找excel里某一列重复数据并且剔除后打印的方法
5星 · 资源好评率100%
可以使用 pandas 库来实现这个需求。具体步骤如下:
1. 使用 pandas 的 read_excel() 方法读取 Excel 文件,将其转换为 DataFrame。
2. 对 DataFrame 进行操作,找到重复出现 3 次的行。可以使用 pandas 的 duplicated() 方法和 value_counts() 方法。
3. 对于找到的重复行,标记它们所在的行。可以使用 pandas 的 loc[] 方法和一个布尔索引。
示例代码如下:
```python
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('data.xlsx')
# 找到重复出现 3 次的行
duplicated_rows = df[df.duplicated(keep=False)]
duplicated_rows = duplicated_rows[duplicated_rows.groupby(list(duplicated_rows.columns)).cumcount() == 2]
# 标记所在行
df.loc[duplicated_rows.index, '重复3次'] = True
# 输出结果
print(df)
```
其中,`duplicated()` 方法用于找到重复行,`value_counts()` 方法用于计算每行出现的次数。`groupby()` 方法和 `cumcount()` 方法用于在重复行中选择第 3 个出现的行。
最后,使用 `loc[]` 方法和布尔索引将重复行所在的行标记为 True。输出结果可以使用 DataFrame 的 `print()` 方法。
阅读全文