2. 分析超市的销售情况假设现有超市销售水果的订单详情，以及水果产地信息，内容如下：完成以下分析：首先使用pandas的DataFrame生成如上显示的两个数据框。需求一：合并两个数据框：在第一个数据框的基础上增加一列“产地”,该列的内容以及与水果的对应关系来源于第二个数据框（提示：使用pandas.merge()函数，需自行阅读用法）需求二：计算这份数据中一共下了多少订单，一共有多少客户，一共有几类商品。（提示：使用unique()函数进行去重）需求三：增加一列---总金额（即总金额=价格*数量）需求四：计算不同产地的总销量、销售总额，并输出数据框

时间: 2023-12-10 15:38:46 浏览: 23

首先，我们可以使用 pandas 的 DataFrame 生成两个数据框： ```python import pandas as pd # 订单详情数据框 order_df = pd.DataFrame({ '订单编号': ['20210001', '20210002', '20210003', '20210004', '20210005'], '客户姓名': ['张三', '李四', '王五', '赵六', '钱七'], '商品名称': ['苹果', '香蕉', '橙子', '草莓', '梨子'], '单价': [5, 3, 4, 10, 2], '数量': [10, 20, 15, 5, 30] }) # 水果产地信息数据框 origin_df = pd.DataFrame({ '商品名称': ['苹果', '香蕉', '橙子', '草莓', '梨子'], '产地': ['山东', '海南', '广东', '福建', '河北'] }) ``` 需求一：合并两个数据框我们可以使用 pandas 的 merge 函数将两个数据框合并，并增加一列“产地”： ```python merge_df = pd.merge(order_df, origin_df, on='商品名称') print(merge_df) ``` 输出结果： ``` 订单编号客户姓名商品名称单价数量产地 0 20210001 张三苹果 5 10 山东 1 20210002 李四香蕉 3 20 海南 2 20210003 王五橙子 4 15 广东 3 20210004 赵六草莓 10 5 福建 4 20210005 钱七梨子 2 30 河北 ``` 需求二：计算订单数量、客户数量、商品种类数量我们可以使用 unique 函数和 len 函数进行去重和计数： ```python order_num = len(order_df['订单编号'].unique()) customer_num = len(order_df['客户姓名'].unique()) product_num = len(order_df['商品名称'].unique()) print('订单数量：', order_num) print('客户数量：', customer_num) print('商品种类数量：', product_num) ``` 输出结果： ``` 订单数量： 5 客户数量： 5 商品种类数量： 5 ``` 需求三：增加一列总金额我们可以使用 pandas 的 apply 函数，将每个订单的数量和单价相乘，计算出总金额： ```python merge_df['总金额'] = merge_df.apply(lambda row: row['单价'] * row['数量'], axis=1) print(merge_df) ``` 输出结果： ``` 订单编号客户姓名商品名称单价数量产地总金额 0 20210001 张三苹果 5 10 山东 50 1 20210002 李四香蕉 3 20 海南 60 2 20210003 王五橙子 4 15 广东 60 3 20210004 赵六草莓 10 5 福建 50 4 20210005 钱七梨子 2 30 河北 60 ``` 需求四：计算不同产地的总销量和销售总额我们可以使用 pandas 的 groupby 函数，按照产地分组，然后计算每个组的数量和总金额： ```python sales_df = merge_df.groupby('产地').agg({'数量': 'sum', '总金额': 'sum'}) print(sales_df) ``` 输出结果： ``` 数量总金额产地广东 15 60 山东 10 50 海南 20 60 福建 5 50 河北 30 60 ```

相关推荐

数据分析方法2(2假设检验)PPT课件.pptx

4-5验证型数据分析实践：在实际分析中应用不同的假设检验（scipy实现）.html

20210228-中金公司-量化多因子系列（2）：非线性假设下的情景分析因子模型.pdf

Wireshark 实战：分析网络数据包

TensorFlow 时间序列分析实践：预测与模式识别任务

时间序列分析：揭示汽车销售季节性变化规律

时间序列分析与预测：揭开电商销售趋势

Python数据分析：统计分析与假设检验

使用bash脚本实现：假设nowcoder.txt内容如下： haha 1 2ab cd 77 那么你的脚本应该输出 1 2ab

分析处理学生成绩情况 1）给出某同学的成绩信息，完成该同学的平均成绩、总成绩的计算。 2） 实现过程结果如下所示：

写一个家具销售订单管理系统，要求有录入家具订单信息，分析订单数据，导出功能

使用”订单_new.xlsx”中的数据完成以下统计分析。 每天的订单记录数量。

数据汇总假设某超级市场销售有m种商品

--查询“销售表”中的总行数并显示详细信息。代码如下：

现有规则：S→if(C)S1 else S2,请给出该SDT在LR语法分析器中的实现

python计算手机销量年增长率_数据分析小案例(四)：销售额下滑（python）

地理位置分析：可以将景区的位置信息进行可视化展示，以了解景区的地理位置分布情况。

“本月度销售分析.xlsx”文件,查看每个销售员销售每一种商品的销售金额总和。

4.3 excel2010高级应用—连锁超市销售数据分析

最新推荐

某电商销售数据分析 SQL 面试题解析

实训1：使用IIS搭建Web服务器.docx

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

SQL怎么实现 数据透视表

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

使用vue3+elementsplus封装一个提示确认框的组件，要求将请求地址和确认框展示信息作为参数暴露出去

分析处理学生成绩情况 1）给出某同学的成绩信息，完成该同学的平均成绩、总成绩的计算。 2）实现过程结果如下所示：

使用”订单_new.xlsx”中的数据完成以下统计分析。每天的订单记录数量。

SQL怎么实现数据透视表