pandas 按某列去重
时间: 2023-07-11 19:31:52 浏览: 89
pandas DataFrame行或列的删除方法的实现示例
5星 · 资源好评率100%
可以使用 drop_duplicates() 方法的 subset 参数来指定按照某一列或多列去重。例如,如果我们要按照 DataFrame 中的列 col1 去重,则可以这样做:
```python
import pandas as pd
# 创建一个包含重复行的 DataFrame
df = pd.DataFrame({
'col1': [1, 2, 2, 3, 3],
'col2': ['a', 'b', 'b', 'c', 'c']
})
# 按照 col1 列去除重复行并打印结果
df = df.drop_duplicates(subset=['col1'])
print(df)
```
这将输出一个去除了按 col1 列重复行的 DataFrame:
```
col1 col2
0 1 a
1 2 b
3 3 c
```
在 subset 参数中,也可以指定多个列,以按多列去重。例如,如果我们要按照 col1 和 col2 两列去重,则可以这样做:
```python
# 按照 col1 和 col2 列去除重复行并打印结果
df = df.drop_duplicates(subset=['col1', 'col2'])
print(df)
```
这将输出一个去除了按 col1 和 col2 列重复行的 DataFrame:
```
col1 col2
0 1 a
1 2 b
3 3 c
```
阅读全文