dataframe删除重复值
时间: 2023-10-11 15:08:26 浏览: 88
在 Pandas 中,可以使用 `drop_duplicates()` 方法来删除 DataFrame 中的重复行。该方法返回一个新的 DataFrame,该 DataFrame 不包含任何重复行。
示例代码如下:
```python
import pandas as pd
# 创建一个包含重复行的 DataFrame
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25]
})
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果为:
```
name age
0 Alice 25
1 Bob 30
2 Charlie 35
```
在上述示例中,我们首先创建了一个包含重复行的 DataFrame。然后,我们使用 `drop_duplicates()` 方法删除重复行,并将结果存储在一个新的 DataFrame 中。最后,我们打印了结果以验证是否成功删除了重复行。
相关问题
dataframe 删除重复值
可以使用 pandas 库中的 drop_duplicates() 方法来删除 dataframe 中的重复值。具体的代码如下:
df.drop_duplicates()
其中,df 是你的 dataframe 对象。这个方法会返回一个新的 dataframe,其中已经删除了重复的行。如果你想要在原 dataframe 上直接修改,可以加上 inplace=True 参数:
df.drop_duplicates(inplace=True)
pandas: DataFrame 删除重复的行
在 Pandas 中,可以使用 drop_duplicates() 方法删除 DataFrame 中的重复行。
示例代码:
```python
import pandas as pd
# 创建 DataFrame
data = {'name': ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob'],
'age': [25, 30, 25, 35, 30],
'city': ['New York', 'Paris', 'London', 'Tokyo', 'Paris']}
df = pd.DataFrame(data)
# 删除重复行
df.drop_duplicates(inplace=True)
# 打印结果
print(df)
```
输出结果:
```
name age city
0 Alice 25 New York
1 Bob 30 Paris
3 Charlie 35 Tokyo
```
可以看到,重复的行已经被删除了。注意,drop_duplicates() 方法默认会判断所有列的值是否相同,只有完全相同的行才会被删除。如果只想根据某些列进行判断,可以使用 subset 参数指定这些列的名称。例如,如果只想根据 name 和 city 这两列进行判断,可以这样写:
```python
df.drop_duplicates(subset=['name', 'city'], inplace=True)
```
阅读全文