使用客户订单详情“order_details.csv" 文件和无人售货机信息box_ list.csv 文件中的数据,计算2018年售货机的商品销售金额,并按照从高到低的顺序进行排序。用spoon做,使用“Join rows (cartesian product)”步骤将这两个数据流进行关联。选择关联字段为售货机编号(box_id),并勾选“保留所有行(笛卡尔积)”选项。具体操作
时间: 2024-03-31 20:35:27 浏览: 62
好的,这里是具体的操作步骤:
1. 打开Spoon,并创建一个新的转换(Transformation)。
2. 从左侧面板中拖动“CSV 文件输入”步骤并放置到画布上。
3. 右键单击“CSV 文件输入”步骤并选择“编辑”选项。
4. 在“CSV 文件输入”步骤的“文件名/目录”字段中选择“order_details.csv”文件。
5. 在“CSV 文件输入”步骤的“字段”选项卡中,确认文件中的字段与下表中的字段匹配。如果不匹配,可以手动更改。
| 字段名 | 数据类型 |
| ------- | ------ |
| order_id | Integer |
| product_id | Integer |
| quantity | Integer |
| order_date | Date |
| price | Float |
6. 点击“确定”保存“CSV 文件输入”步骤的设置。
7. 从左侧面板中拖动第二个“CSV 文件输入”步骤并放置到画布上。
8. 右键单击第二个“CSV 文件输入”步骤并选择“编辑”选项。
9. 在第二个“CSV 文件输入”步骤的“文件名/目录”字段中选择“box_list.csv”文件。
10. 在第二个“CSV 文件输入”步骤的“字段”选项卡中,确认文件中的字段与下表中的字段匹配。如果不匹配,可以手动更改。
| 字段名 | 数据类型 |
| ------- | ------ |
| box_id | Integer |
| location | String |
| install_date | Date |
11. 点击“确定”保存第二个“CSV 文件输入”步骤的设置。
12. 拖动“Join rows (cartesian product)”步骤并将其放置到画布上。
13. 连接“CSV 文件输入”步骤和“Join rows (cartesian product)”步骤,然后连接第二个“CSV 文件输入”步骤和“Join rows (cartesian product)”步骤。
14. 右键单击“Join rows (cartesian product)”步骤并选择“编辑”选项。
15. 在“Join rows (cartesian product)”步骤的“主流”选项卡中,选择“box_id”字段作为关联字段。
16. 勾选“保留所有行(笛卡尔积)”选项。
17. 点击“确定”保存“Join rows (cartesian product)”步骤的设置。
18. 拖动“Group by”步骤并将其放置到画布上。
19. 连接“Join rows (cartesian product)”步骤和“Group by”步骤。
20. 右键单击“Group by”步骤并选择“编辑”选项。
21. 在“Group by”步骤的“字段”选项卡中,选择“box_id”和“product_id”字段作为分组字段。
22. 在“Group by”步骤的“聚合”选项卡中,选择“price”字段,使用“Sum”函数进行求和。
23. 点击“确定”保存“Group by”步骤的设置。
24. 拖动“Sort rows”步骤并将其放置到画布上。
25. 连接“Group by”步骤和“Sort rows”步骤。
26. 右键单击“Sort rows”步骤并选择“编辑”选项。
27. 在“Sort rows”步骤的“字段”选项卡中,选择“price”字段,并选择“从高到低”排序。
28. 点击“确定”保存“Sort rows”步骤的设置。
29. 最后,拖动“CSV 文件输出”步骤并将其放置到画布上。
30. 连接“Sort rows”步骤和“CSV 文件输出”步骤。
31. 右键单击“CSV 文件输出”步骤并选择“编辑”选项。
32. 在“CSV 文件输出”步骤的“文件名/目录”字段中,选择输出文件的路径和名称。
33. 在“CSV 文件输出”步骤的“字段”选项卡中,确认输出字段与下表中的字段匹配。如果不匹配,可以手动更改。
| 字段名 | 数据类型 |
| ------- | ------ |
| box_id | Integer |
| product_id | Integer |
| price | Float |
34. 点击“确定”保存“CSV 文件输出”步骤的设置。
35. 点击画布上方的“运行”按钮运行转换。
这样,你就可以得到一个按照售货机编号和商品销售金额排序的结果文件。