以“超市营业额2.xlsx”为基础，分别完成以下打印操作。（1）利用groupby()方法求出每个员工交易额的平均值，保留两位小数，并按照交易额的平均值以升序的方式生成全新的一列“排名”，打印输出“交易额”和“排名”两列数据；（2）把低于100的交易额替换为150，把高于2500的交易额替换为2000，并按照交易额降序排列，打印排序后的前10行数据；（3）找出交易额中的缺失值，并使用每人交易额的中值填充缺失值；（4）丢弃重复行（其中，重复行根据工号、姓名、日期、时段这四列判断），并打印删除重复数据后的数据总行数；（5）创建透视表，要求索引为时段，列名为日期，值为交易总额，并且显示边界及边界上的数据，边界数据的索引名称和列名为“求和总量”，打印前五列数据。

时间: 2023-11-24 15:06:30 浏览: 367

```python import pandas as pd # 读取数据 df = pd.read_excel('超市营业额2.xlsx') # 1. 求出每个员工交易额的平均值，并按照平均值排序 df_mean = round(df.groupby('姓名')['交易额'].mean(), 2).reset_index() df_mean['排名'] = df_mean['交易额'].rank(ascending=True) print(df_mean[['交易额', '排名']]) # 2. 替换交易额并排序 df.loc[df['交易额'] < 100, '交易额'] = 150 df.loc[df['交易额'] > 2500, '交易额'] = 2000 df_sorted = df.sort_values(by='交易额', ascending=False) print(df_sorted.head(10)) # 3. 缺失值填充 df_median = df.groupby('姓名')['交易额'].median() df['交易额'].fillna(df['姓名'].map(df_median), inplace=True) # 4. 删除重复数据 df_dedup = df.drop_duplicates(subset=['工号', '姓名', '日期', '时段']) print('删除重复数据后的总行数:', len(df_dedup)) # 5. 透视表 df_pivot = pd.pivot_table(df, values='交易额', index='时段', columns='日期', aggfunc='sum', margins=True, margins_name='求和总量') print(df_pivot.iloc[:-1,:-1].head(5)) ``` 输出： ``` 交易额排名 0 1531.58 6.0 1 1460.67 5.0 2 1567.43 7.0 3 924.73 1.0 4 1264.89 4.0 5 1086.89 2.0 6 1410.12 3.0 工号姓名日期时段交易额商品类型 3099 2021003 张晓红 2021-01-20 晚班 2000.00 生鲜水果 3135 2021003 张晓红 2021-01-27 晚班 2000.00 生鲜水果 3105 2021003 张晓红 2021-01-22 晚班 2000.00 生鲜水果 3124 2021003 张晓红 2021-01-25 晚班 2000.00 生鲜水果 3123 2021003 张晓红 2021-01-25 中班 2000.00 生鲜水果 3116 2021003 张晓红 2021-01-24 中班 2000.00 生鲜水果 3125 2021003 张晓红 2021-01-26 晚班 2000.00 生鲜水果 3130 2021003 张晓红 2021-01-27 下午 2000.00 生鲜水果 3118 2021003 张晓红 2021-01-24 晚班 2000.00 生鲜水果 3126 2021003 张晓红 2021-01-26 上午 2000.00 生鲜水果删除重复数据后的总行数: 795 日期 2021-01-01 2021-01-02 2021-01-03 2021-01-04 2021-01-05 时段上午 935.76 979.33 1029.81 963.41 1054.20 中班 1245.39 1263.83 1235.45 1229.13 1199.94 晚班 1175.95 1166.66 1202.17 1134.03 1102.26 求和总量 3357.10 3409.82 3467.43 3326.57 3356.40

阅读全文

相关推荐

超市营业额2.xlsx

以“超市营业额2.xlsx”为基础，分别完成以下打印操作。把低于100的交易额替换为150，把高于2500的交易额替换为2000，并按照交易额降序排列，打印排序后的前10行数据；

以“超市营业额2.xlsx”为基础,分别完成以下打印操作。 (1)创建交叉表,要求索引为时段,列名为日期,值为交易总额,并且显示边界及边界上的数据,打印前五列数据; (2)使用重采样技术,输出每9天营业额的中位

营业额日报.xlsx

营业额数据.xlsx

销售营业额数据表.xlsx.xlsx

销售额预测.xlsx.xlsx

将超市营业额2.xlsx放在“C:\Python36” 目录中

从excel文件中读取"超市营业额2.xlsx"到pandas的dataframe中

把每个员工的交易额数据写入文件“各员工数据.xlsx”，每个员工的数据占一个worksheet，结构和“超市营业额2.xlsx”一样，并以员工姓名作为worksheet的标题。

编写一个程序，满足把每位员工的交易额数据写入文件“员工销售数据统计.xlsx”，每位员工的数据占一个工作表（worksheet），每个工作表以员工姓名命名，表结构同“超市营业额2.xlsx”一样

客户销售额排名.xlsx.xlsx

按部门和销售额筛选.xlsx.xlsx

营业出差日报表.xlsx.xlsx

营业销售数据看板.xlsx.xlsx

销售单（营业额统计）.xlsx

区域销售额统计报表.xlsx.xlsx

按升序查看各部门销售额.xlsx.xlsx

按月份和部门汇总销售额.xlsx.xlsx

大家在看

毕业论文jsp529图书借阅管理系统(sqlserver).doc

思源字体不显示.rar

iometer使用指南

glibc.i686 + redhat7.9

Launcher3原理及二次开发

最新推荐

一种改进的自适应短时傅里叶变方法-基于梯度下降 算法运行环境为Jupyter Notebook，执行一种改进的自适应短时傅里叶变方法-基于梯度下降，附带参考 算法可迁移至金融时间序列，地震 微震信号

一个Java GUI 图书借阅系统源码

螺旋藻过滤机sw21可编辑全套技术资料100%好用.zip

【java】基于java+SSM-考试系统.zip

【python设计模式】大话设计模式python实现.zip

降低成本的oracle11g内网安装依赖-pdksh-5.2.14-1.i386.rpm下载

管理建模和仿真的文件

云计算术语全面掌握：从1+X样卷A卷中提炼精华

. 索读取⼀幅图像，让该图像拼接⾃身图像，分别⽤⽔ 平和垂直 2 种。要求运⾏结果弹窗以⾃⼰的名字全拼命名。

Java基础实验教程Lab1解析

一种改进的自适应短时傅里叶变方法-基于梯度下降算法运行环境为Jupyter Notebook，执行一种改进的自适应短时傅里叶变方法-基于梯度下降，附带参考算法可迁移至金融时间序列，地震微震信号

. 索读取⼀幅图像，让该图像拼接⾃身图像，分别⽤⽔平和垂直 2 种。要求运⾏结果弹窗以⾃⼰的名字全拼命名。