在去重后的文件exp2_4.csv上统计每位艺人每首歌曲每天的播放量,第一列为艺人id,第二列为歌曲,第三列为日期,第四列为播放量,并分别按照艺人、歌曲、日期排序,保存到exp2_5.csv。
时间: 2023-06-05 20:05:24 浏览: 119
记录歌曲播放时间
好的,这是一个数据处理问题,我可以帮您解决。以下是问题的解决方案:
首先,您需要加载文件exp2_4.csv并删除其中的重复记录。您可以使用Python中的pandas库来完成此任务。
示例代码如下:
```
import pandas as pd
# 加载文件
df = pd.read_csv('exp2_4.csv')
# 删除重复记录
df = df.drop_duplicates()
# 将结果按照艺人、歌曲、日期分组并求和
grouped = df.groupby(['艺人id', '歌曲', '日期'])['播放量'].sum()
# 将结果保存到exp2_5.csv中
grouped.to_csv('exp2_5.csv')
```
这段代码将加载文件exp2_4.csv,并删除其中的重复记录。然后,它将结果按照艺人、歌曲、日期分组并求和。最后,它将结果保存到exp2_5.csv中。
请注意,这只是一个示例代码,您可能需要根据数据的实际情况进行修改。同时,如果您有任何问题或疑问,请随时向我提问。
阅读全文