用python将csv文件中有重复的某一列按照不同类别排序,重复的行按照相同的元素进行整数排列,不同的行用不同的整数,从1开始递增,用排列替代原本的列,不删除重复的行
时间: 2023-05-15 08:06:54 浏览: 199
py代码-处理csv文件重复数据
可以使用 pandas 库来实现这个功能。首先,读取 csv 文件并将其转换为 pandas 的 DataFrame 对象:
```python
import pandas as pd
df = pd.read_csv('file.csv')
```
然后,使用 `groupby` 函数按照重复的列进行分组,并使用 `ngroup` 函数为每个组分配一个唯一的整数编号:
```python
groups = df.groupby('重复的列')
df['排列'] = groups.ngroup() + 1
```
最后,使用 `sort_values` 函数按照不同类别排序:
```python
df = df.sort_values(['不同的列', '排列'])
```
这样就可以得到按照不同类别排序,重复的行按照相同的元素进行整数排列的 DataFrame 对象了。
阅读全文