请写一段Python代码,有dataframe df1,共10个字段,订单编号有很多重复值,按订单编号去重
时间: 2024-03-12 15:49:47 浏览: 81
python去掉重复字段,只需改输入文件名称和输出文件名称即可
假设pandas库已经导入,并且df1是一个名为"df1"的DataFrame对象,可以使用以下Python代码按订单编号去重:
```python
import pandas as pd
# 按订单编号去重,只选取第一个出现的值
df1 = df1.drop_duplicates(subset=['订单编号'], keep='first')
# 输出结果
print(df1)
```
这段代码使用DataFrame的drop_duplicates()方法按订单编号去重,只选取第一个出现的值。subset参数指定按哪些列去重,keep参数指定保留哪一个重复值(这里选取第一个出现的值)。最后输出去重后的结果。
阅读全文