Python用subset怎么找Excel中某几列相同,一列不相同的行的代码
时间: 2023-06-06 13:04:32 浏览: 165
Python实现两个Excel匹配两列相同数据
可以使用 pandas 库来实现这个需求,具体代码如下:
```python
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('example.xlsx')
# 选取需要比较的列,示例中为 A 列到 C 列
cols_to_compare = ['A', 'B', 'C']
# 根据选取的列生成新的 DataFrame,并去重
df_unique = df.drop_duplicates(subset=cols_to_compare)
# 找到重复的行,即某几列相同,一列不相同的情况
df_dup = df[~df.index.isin(df_unique.index)]
# 输出结果
print(df_dup)
```
其中,`cols_to_compare` 存储了需要比较的列名,`df.drop_duplicates(subset=cols_to_compare)` 会生成一个新的 DataFrame,其中每一行都是指定列中的值都相同的行,然后使用 `~df.index.isin(df_unique.index)` 筛选出新 DataFrame 中没有的行,即重复的行,最后输出即可。
阅读全文