Platform_top10 = data.groupby(by='Platform')['Global_Sales'].sum().sort_values(ascending=False)[:10].index Platform_top10_df = pd.pivot_table(data=data[data.Platform.isin(Platform_top10)][['Platform','Year','Global_Sales']],index='Year',columns='Platform',values='Global_Sales',aggfunc=np.sum) Platform_top10_df.plot(title='游戏平台top10销售额趋势',figsize=(15,5)) plt.show()
时间: 2023-09-17 10:08:58 浏览: 71
LINQ_to_SQL.zip_SUM_linq
这段代码执行了以下操作:
首先,通过 `data.groupby(by='Platform')['Global_Sales'].sum().sort_values(ascending=False)[:10].index` 对数据集按照平台(Platform)进行分组,并计算每个平台的全球销售额总和。然后,通过 `[:10].index` 取出销售额最高的前十个平台,并将结果存储在变量 `Platform_top10` 中。
接下来,通过 `data[data.Platform.isin(Platform_top10)][['Platform','Year','Global_Sales']]` 筛选出数据集中平台在 `Platform_top10` 中的行,并仅保留 'Platform'、'Year' 和 'Global_Sales' 列。
然后,通过 `pd.pivot_table()` 对筛选后的数据进行透视,以年份(Year)作为索引,平台(Platform)作为列,全球销售额(Global_Sales)作为值,使用 `np.sum` 函数计算总和。结果存储在变量 `Platform_top10_df` 中。
最后,使用 `Platform_top10_df.plot()` 绘制折线图,标题为 '游戏平台top10销售额趋势',图表的大小为 (15,5)。
最后一行的 `plt.show()` 用于显示图表。
阅读全文