pandas删除指定重复列的行
时间: 2023-06-05 13:04:36 浏览: 60
可以使用 pandas 中的 drop_duplicates 方法来删除指定列的重复行。代码示例如下:
```python
import pandas as pd
# 创建示例数据
df = pd.DataFrame({
'A': [1, 2, 3, 4, 2],
'B': [4, 5, 6, 7, 5],
'C': [7, 8, 9, 10, 8],
})
# 删除重复行
df.drop_duplicates(subset=['A'], keep=False, inplace=True)
# 输出结果
print(df)
```
上述代码中,我们通过 `subset` 参数指定需要删除重复行的列,这里我们选择了列名为 `A` 的列。`keep` 参数指定保留重复行的方式,`False` 表示全部删除。最后使用 `inplace` 参数将修改保存到原始 DataFrame 中。
相关问题
pandas按列删除重复行
你可以使用pandas库的drop_duplicates()函数按列删除重复行。可以指定列名或列的索引来决定哪些列需要考虑重复。下面是一个示例代码:
```python
import pandas as pd
# 创建一个包含重复数据的DataFrame
df = pd.DataFrame({
'A': [1, 1, 2, 2],
'B': ['a', 'b', 'a', 'b']
})
# 按列删除重复行
df.drop_duplicates(subset=['B'], inplace=True)
print(df)
```
这个代码将会输出:
```
A B
0 1 a
1 1 b
```
在这个例子中,我们按B列删除了重复行,因此只有第一行和第二行被保留下来。
pandas删除某一列中的重复数据
可以使用pandas库中的drop_duplicates函数删除某一列中的重复数据,具体的方法如下:
假设要删除DataFrame df中的列col中的重复数据,可以使用如下代码:
```
df.drop_duplicates(subset=['col'], inplace=True)
```
其中,subset参数指定要删除重复数据的列,inplace参数指定是否在原DataFrame上修改,当为True时表示在原DataFrame上修改,为False时表示返回一个新的DataFrame。