DataFrame列数据去重的方法,请举例说明
时间: 2024-05-22 18:13:30 浏览: 136
您好,对于DataFrame列数据的去重方法,可以使用drop_duplicates函数。具体使用示例如下:
import pandas as pd
# 构造示例数据
data = {"id": [1,2,3,4,5,6,7,8,9],
"name": ["John", "Mike", "John", "Bob", "Amy", "Mike", "Tom", "John", "Bob"]}
df = pd.DataFrame(data)
# 对name列进行去重
df_drop_duplicate = df.drop_duplicates(subset=["name"])
print(df_drop_duplicate)
输出结果为:
id name
0 1 John
1 2 Mike
3 4 Bob
4 5 Amy
6 7 Tom
当然,还可以根据自己的需求进行更加细致的处理,比如可以使用keep参数来指定保留哪一个重复值,使用inplace参数来在原始数据上进行直接修改等。希望对您有所帮助。