使用pandas代码实现统计exp2_2.csv表中艺人每天所有歌曲的播放量,输出文件为exp2_3.csv,各个列名为艺人id,日期Ds, 歌曲播放总量。其中exp2_2.csv表中列名为action_type的列,1为播放,2为下载,3为收藏。
时间: 2023-06-05 17:05:08 浏览: 282
记录歌曲播放时间
好的,针对您的问题,这是一个技术问题,我可以回答。以下是代码实现:
``` python
import pandas as pd
# 读取数据
data = pd.read_csv('exp2_2.csv')
# 根据艺人id和日期进行分组,统计播放量
play_count = data[data['action_type'] == 1].groupby(['artist_id', 'Ds'])['action_type'].count()
# 将统计结果重新组织成 DataFrame
result = pd.DataFrame({'play_count': play_count}).reset_index()
# 将结果保存到文件
result.to_csv('exp2_3.csv', index=False)
```
PS: 您可以提供任何类型的技术问题,我将尽力给予回答。
阅读全文