dataframe删除重复
时间: 2023-10-11 19:08:24 浏览: 39
要在DataFrame中删除重复行,可以使用`drop_duplicates()`方法。该方法返回一个新的DataFrame,其中包含不重复的行。
示例代码:
```python
import pandas as pd
# 创建一个包含重复行的DataFrame
df = pd.DataFrame({
'col1': ['a', 'b', 'c', 'a'],
'col2': [1, 2, 3, 1]
})
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果:
```
col1 col2
0 a 1
1 b 2
2 c 3
```
在上面的代码中,我们创建了一个包含重复行的DataFrame。然后,我们使用`drop_duplicates()`方法删除重复行,并将结果赋值给原始变量`df`。最后,我们打印结果,可以看到重复行已经被删除了。
相关问题
dataframe删除重复值
在 Pandas 中,可以使用 `drop_duplicates()` 方法来删除 DataFrame 中的重复行。该方法返回一个新的 DataFrame,该 DataFrame 不包含任何重复行。
示例代码如下:
```python
import pandas as pd
# 创建一个包含重复行的 DataFrame
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25]
})
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果为:
```
name age
0 Alice 25
1 Bob 30
2 Charlie 35
```
在上述示例中,我们首先创建了一个包含重复行的 DataFrame。然后,我们使用 `drop_duplicates()` 方法删除重复行,并将结果存储在一个新的 DataFrame 中。最后,我们打印了结果以验证是否成功删除了重复行。
dataframe删除重复列
在pandas中,可以使用`drop_duplicates()`方法删除重复的行,但是如果想要删除重复的列,则可以使用以下方法:
```python
import pandas as pd
# 创建一个包含重复列的DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [1, 2, 3], 'D': [4, 5, 6]})
# 使用transpose()方法将行列转置,然后使用drop_duplicates()方法删除重复行,最后再次转置
df = df.transpose().drop_duplicates().transpose()
print(df)
```
输出结果:
```
A B
0 1 4
1 2 5
2 3 6
```
该方法的思路是先将DataFrame转置为以列为行的形式,然后使用`drop_duplicates()`方法删除重复行,最后再次转置回来。这样就可以删除重复的列了。