我有一个数据集,里面有两列userid和itemid,我现在需要统计每个userid里有多少个itmid,并把结果返回到原数据集的新列中
时间: 2023-03-29 18:03:55 浏览: 97
您好,这个问题可以使用Python语言进行处理。您可以使用pandas库中的groupby函数对userid进行分组,然后使用count函数统计每个userid对应的itemid数量,并将结果添加到原数据集的新列中。具体代码如下:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv('your_dataset.csv')
# 对userid进行分组,统计每个userid对应的itemid数量
count = data.groupby('userid')['itemid'].count()
# 将统计结果添加到原数据集的新列中
data['item_count'] = data['userid'].map(count)
# 输出结果
print(data)
```
希望能对您有所帮助。
阅读全文