dataframe去重复
时间: 2023-12-03 17:28:22 浏览: 73
去除重复数据
要对DataFrame进行去重操作,可以使用`drop_duplicates()`方法。该方法会删除DataFrame中的重复行。
以下是使用`drop_duplicates()`方法去除DataFrame中重复行的示例:
```python
import pandas as pd
# 创建包含重复行的示例DataFrame
df = pd.DataFrame({'A': [1, 2, 2, 3,4],
'B': ['a', 'b', 'b', 'c', 'c']})
# 去除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果:
```
A B
0 1 a
1 2 b
3 3 c
```
在上述示例中,原始DataFrame包含重复行。通过调用`drop_duplicates()`方法,我们可以得到一个去除重复行的新DataFrame。
阅读全文