python:csv表增加一列id位于第一列,id内容按照url分组从1000往后自增,url重复的id为同一个
时间: 2024-03-10 17:44:05 浏览: 22
可以使用Python中的pandas库来实现该功能,具体代码如下所示:
```python
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 按照url分组,为每个组分配一个唯一的id
grouped = df.groupby('url')
id_dict = {}
id_count = 1000
for name, group in grouped:
id_dict[name] = id_count
id_count += 1
# 增加一列id并填充数据
df.insert(0, 'id', df['url'].apply(lambda x: id_dict[x]))
# 将结果写入CSV文件
df.to_csv('new_data.csv', index=False)
```
以上代码将根据url分组,为每个组分配一个唯一的id,并将该id作为新的第一列添加到CSV文件中。如果有多个url相同的行,则它们将被赋予相同的id。最后,将结果写入到新的CSV文件中,其中不包括索引列。