pandas: DataFrame 删除重复的行
时间: 2024-05-09 11:21:15 浏览: 101
在 Pandas 中,可以使用 drop_duplicates() 方法删除 DataFrame 中的重复行。
示例代码:
import pandas as pd
# 创建 DataFrame
data = {'name': ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob'],
'age': [25, 30, 25, 35, 30],
'city': ['New York', 'Paris', 'London', 'Tokyo', 'Paris']}
df = pd.DataFrame(data)
# 删除重复行
df.drop_duplicates(inplace=True)
# 打印结果
print(df)
输出结果:
name age city
0 Alice 25 New York
1 Bob 30 Paris
3 Charlie 35 Tokyo
可以看到,重复的行已经被删除了。注意,drop_duplicates() 方法默认会判断所有列的值是否相同,只有完全相同的行才会被删除。如果只想根据某些列进行判断,可以使用 subset 参数指定这些列的名称。例如,如果只想根据 name 和 city 这两列进行判断,可以这样写:
df.drop_duplicates(subset=['name', 'city'], inplace=True)
相关推荐
















