dataframe删除某一列值重复的行
时间: 2023-09-12 16:08:38 浏览: 126
可以使用 `drop_duplicates` 方法来删除某一列值重复的行。
假设要删除名为 `col_name` 的列中值重复的行,可以按照以下方式操作:
```python
df.drop_duplicates(subset=['col_name'], keep='first', inplace=True)
```
其中,`subset` 参数指定要考虑的列名或列名列表,`keep` 参数指定保留哪些值,`inplace` 参数指定是否在原始 DataFrame 上进行修改。
例如,以下代码删除名为 `age` 的列中值重复的行:
```python
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Bob'],
'age': [25, 30, 35, 40, 30],
'gender': ['F', 'M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
df.drop_duplicates(subset=['age'], keep='first', inplace=True)
print(df)
```
输出:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 David 40 M
4 Bob 30 M
name age gender
0 Alice 25 F
1 Bob 30 M
3 David 40 M
```
阅读全文