dataframe删除重复
时间: 2023-10-11 09:08:24 浏览: 72
要在DataFrame中删除重复行,可以使用`drop_duplicates()`方法。该方法返回一个新的DataFrame,其中包含不重复的行。
示例代码:
```python
import pandas as pd
# 创建一个包含重复行的DataFrame
df = pd.DataFrame({
'col1': ['a', 'b', 'c', 'a'],
'col2': [1, 2, 3, 1]
})
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果:
```
col1 col2
0 a 1
1 b 2
2 c 3
```
在上面的代码中,我们创建了一个包含重复行的DataFrame。然后,我们使用`drop_duplicates()`方法删除重复行,并将结果赋值给原始变量`df`。最后,我们打印结果,可以看到重复行已经被删除了。
相关问题
dataframe删除重复值
在 Pandas 中,可以使用 `drop_duplicates()` 方法来删除 DataFrame 中的重复行。该方法返回一个新的 DataFrame,该 DataFrame 不包含任何重复行。
示例代码如下:
```python
import pandas as pd
# 创建一个包含重复行的 DataFrame
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25]
})
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果为:
```
name age
0 Alice 25
1 Bob 30
2 Charlie 35
```
在上述示例中,我们首先创建了一个包含重复行的 DataFrame。然后,我们使用 `drop_duplicates()` 方法删除重复行,并将结果存储在一个新的 DataFrame 中。最后,我们打印了结果以验证是否成功删除了重复行。
dataframe 删除重复值
可以使用 pandas 库中的 drop_duplicates() 方法来删除 dataframe 中的重复值。具体的代码如下:
df.drop_duplicates()
其中,df 是你的 dataframe 对象。这个方法会返回一个新的 dataframe,其中已经删除了重复的行。如果你想要在原 dataframe 上直接修改,可以加上 inplace=True 参数:
df.drop_duplicates(inplace=True)
阅读全文