dataframe删除重复
时间: 2023-10-11 11:08:24 浏览: 67
Python代码源码-实操案例-框架案例-重复数据处理(df.drop duplicates方法).zip
要在DataFrame中删除重复行,可以使用`drop_duplicates()`方法。该方法返回一个新的DataFrame,其中包含不重复的行。
示例代码:
```python
import pandas as pd
# 创建一个包含重复行的DataFrame
df = pd.DataFrame({
'col1': ['a', 'b', 'c', 'a'],
'col2': [1, 2, 3, 1]
})
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果:
```
col1 col2
0 a 1
1 b 2
2 c 3
```
在上面的代码中,我们创建了一个包含重复行的DataFrame。然后,我们使用`drop_duplicates()`方法删除重复行,并将结果赋值给原始变量`df`。最后,我们打印结果,可以看到重复行已经被删除了。
阅读全文