我有一个数据集,里面有两列userid和itemid,我现在需要统计每个userid里有多少个itmid,并把结果返回到原数据集的新列中
时间: 2023-03-29 19:03:55 浏览: 68
您好,这个问题可以使用Python语言进行处理。您可以使用pandas库中的groupby函数对userid进行分组,然后使用count函数统计每个userid对应的itemid数量,并将结果添加到原数据集的新列中。具体代码如下:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv('your_dataset.csv')
# 对userid进行分组,统计每个userid对应的itemid数量
count = data.groupby('userid')['itemid'].count()
# 将统计结果添加到原数据集的新列中
data['item_count'] = data['userid'].map(count)
# 输出结果
print(data)
```
希望能对您有所帮助。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)