使用pandas 筛选单个列表重复值和两个列表重复值
时间: 2023-06-17 08:07:35 浏览: 84
筛选单个列表重复值可以使用pandas库中的duplicated()函数。例如,假设有一个名为df的DataFrame对象,其中一列为“列1”,则可以使用以下代码筛选出“列1”中的重复值:
```python
import pandas as pd
# 创建DataFrame对象
df = pd.DataFrame({'列1': ['a', 'b', 'c', 'a', 'd', 'b']})
# 筛选出“列1”中的重复值
duplicated = df['列1'].duplicated()
# 打印出重复值
print(df[duplicated])
```
输出结果为:
```
列1
3 a
5 b
```
而筛选两个列表重复值,则可以使用pandas库中的duplicated()函数结合“&”操作符来实现。例如,假设有一个名为df的DataFrame对象,其中一列为“列1”,另一列为“列2”,则可以使用以下代码筛选出“列1”和“列2”中的重复值:
```python
import pandas as pd
# 创建DataFrame对象
df = pd.DataFrame({'列1': ['a', 'b', 'c', 'a', 'd', 'b'], '列2': [1, 2, 3, 1, 4, 2]})
# 筛选出“列1”和“列2”中的重复值
duplicated = df.duplicated(['列1', '列2'])
# 打印出重复值
print(df[duplicated])
```
输出结果为:
```
列1 列2
3 a 1
5 b 2
```
阅读全文