pandas删除第一次出现的重复代码,求代码
时间: 2023-06-03 18:02:24 浏览: 62
可以使用 pandas 库的 drop_duplicates() 方法来删除重复行,其中可以使用 keep 参数来指定保留哪个重复行,传入参数为 first 表示保留第一次出现的重复行。示例代码如下:
```python
import pandas as pd
df = pd.DataFrame({'id': [1, 2, 3, 4, 4],
'name': ['Tom', 'Jerry', 'Lucy', 'Tom', 'Lucy']})
# 删除第一次出现的重复行
df.drop_duplicates(subset='id', keep='first', inplace=True)
print(df)
```
输出结果为:
```
id name
0 1 Tom
1 2 Jerry
2 3 Lucy
3 4 Tom
```
相关问题
pandas删除重复数据的第一次出现,求代码
可以使用pandas中的`drop_duplicates`方法,设定参数`keep='last'`来保留最后一次出现的数据。代码如下:
```python
import pandas as pd
# 创建示例数据
data = {'col1': [1, 2, 3, 1, 2, 3],
'col2': ['a', 'b', 'c', 'd', 'e', 'f']}
df = pd.DataFrame(data)
# 删除重复数据中的第一次出现
df.drop_duplicates(subset=['col1'], keep='last', inplace=True)
# 输出结果
print(df)
```
输出结果如下:
```
col1 col2
2 3 c
4 2 e
5 3 f
```
python实现csv当年份和证券代码相同时,删除重复数据,保留第一次出现的数据
可以使用Python的pandas库来实现该功能。代码示例如下:
```python
import pandas as pd
df = pd.read_csv('data.csv')
df.drop_duplicates(subset=['Year', 'Code'], keep='first', inplace=True)
df.to_csv('output.csv', index=False)
```
其中,`data.csv`是原始数据文件,`output.csv`是去重后保存的文件。`drop_duplicates`函数的`subset`参数指定按照哪些列判断重复,`keep`参数指定保留哪个重复行,`inplace`参数指定是否在原始数据上进行修改。