# 先筛选“非酒精饮料”类型的商品,然后求百分比,然后输出结果到文件。 # 挑选商品类别为“非酒精饮料”并排序 import warnings selected_goods = sort_links.loc[sort_links['Types'] == '非酒精饮料'] # 对所有的“非酒精饮料”求和 child_nums = selected_goods['id'].sum() # 求百分比 selected_goods.loc[:,'child_percent'] = selected_goods.apply(lambda line: line['id']/child_nums,axis = 1) selected_goods.rename(columns = {'id':'count'},inplace = True) outfile2 = 'child_percent.csv' # 输出结果 sort_link_group.to_csv(outfile2, index = False,header = True,encoding='gbk') print('非酒精饮料内部商品的销量及其占比:\n') selected_goods标记注释
时间: 2024-01-26 20:04:25 浏览: 58
sort_sum.rar_SUM_sort和sum
该段代码的作用是:基于前面商品类型销量排名的结果,筛选出“非酒精饮料”类型的商品,并计算其销量占比,并将结果输出到文件中。其中,使用了pandas库的loc函数筛选出商品类型为“非酒精饮料”的商品数据,使用sum函数计算出这些商品的销量之和。然后,使用apply函数对每一行进行遍历,计算出“非酒精饮料”中每个商品的销量占比,使用rename函数更改列名,将“id”列更改为“count”列,将“child_percent”列作为新的列添加到selected_goods中。最后,使用to_csv函数将结果输出到名为"child_percent.csv"的文件中,其中,使用index=False参数表示不输出行索引,header=True表示输出列名,encoding='gbk'表示使用GBK编码保存文件。最后,使用print函数输出文字提示以及结果。
阅读全文