python pandas dataframe去重
时间: 2024-02-04 17:09:54 浏览: 196
pandas金融实战
在Python中,使用pandas库可以很方便地对DataFrame进行去重操作。DataFrame是pandas库中的一个数据结构,类似于Excel表格,可以存储和处理二维数据。
要对DataFrame进行去重,可以使用DataFrame的`drop_duplicates()`方法。该方法会返回一个新的DataFrame,其中包含去重后的数据。
下面是一个示例代码,演示如何对DataFrame进行去重操作:
```python
import pandas as pd
# 创建一个包含重复数据的DataFrame
data = {'col1': [1, 2, 3, 1, 2, 3],
'col2': ['a', 'b', 'c', 'a', 'b', 'c']}
df = pd.DataFrame(data)
# 打印原始的DataFrame
print("原始的DataFrame:")
print(df)
# 对DataFrame进行去重
df_unique = df.drop_duplicates()
# 打印去重后的DataFrame
print("去重后的DataFrame:")
print(df_unique)
```
运行以上代码,输出结果如下:
```
原始的DataFrame:
col1 col2
0 1 a
1 2 b
2 3 c
3 1 a
4 2 b
5 3 c
去重后的DataFrame:
col1 col2
0 1 a
1 2 b
2 3 c
```
可以看到,去重后的DataFrame中只保留了唯一的行。
阅读全文