对以下代码进行讲解:df1 = pd.read_excel('附件2(Attachment 2)2023-51MCM-Problem B.xlsx', index_col=None) df2 = pd.read_excel('附件3(Attachment 3)2023-51MCM-Problem B.xlsx', index_col=None) df1_grouped = df1.groupby(['日期(年/月/日) (Date Y/M/D)','发货城市 (Delivering city)', '收货城市 (Receiving city)'])['快递运输数量(件) (Express delivery quantity (PCS))'].sum().reset_index() df2_grouped = df2.groupby(['起点 (Start)'])['终点 (End)'] cities = set(df2['起点 (Start)'].tolist() + df2['终点 (End)'].tolist()) workbook = load_workbook(filename="附件3(Attachment 3)2023-51MCM-Problem B.xlsx") sheet = workbook.active data = [[cell.value for cell in row[:3]] for row in sheet.iter_rows(min_row=2)] date = '2023-04-23' df1_date = df1[df1['日期(年/月/日) (Date Y/M/D)'] == date] data1 = list(zip(df1_date['发货城市 (Delivering city)'], df1_date['收货城市 (Receiving city)'], df1_date['快递运输数量(件) (Express delivery quantity (PCS))'])) G=nx.DiGraph() G.add_nodes_from(cities) G.add_weighted_edges_from(data) cost=0 for i in data1: start_city=i[0] end_city=i[1] weight_huo=i[2] print(dijkstra_path(G,start_city,end_city,weight="weight")) print(dijkstra_path_length(G,start_city,end_city,weight="weight")*(1+ (weight_huo/200)*(weight_huo/200)*(weight_huo/200))) cost=cost+dijkstra_path_length(G,start_city,end_city,weight="weight")*(1+ (weight_huo/200)*(weight_huo/200)*(weight_huo/200)) print(cost)
时间: 2024-04-12 11:34:07 浏览: 142
详解pandas数据合并与重塑(pd.concat篇)
5星 · 资源好评率100%
这段代码主要是对两个Excel文件中的数据进行处理,并使用Dijkstra算法计算货物运输的成本。
首先,代码通过`pd.read_excel`函数读取了两个Excel文件,分别是'附件2(Attachment 2)2023-51MCM-Problem B.xlsx'和'附件3(Attachment 3)2023-51MCM-Problem B.xlsx'。`index_col=None`参数表示不使用任何列作为索引。
接下来,使用`groupby`函数对第一个Excel文件进行分组操作。按照'日期(年/月/日) (Date Y/M/D)'、'发货城市 (Delivering city)'和'收货城市 (Receiving city)'这三列进行分组,并计算'快递运输数量(件) (Express delivery quantity (PCS))'列的总和。结果保存在`df1_grouped`中。
同样地,对第二个Excel文件进行分组操作,按照'起点 (Start)'这一列进行分组。结果保存在`df2_grouped`中。
接下来,通过将第二个Excel文件中的'起点 (Start)'和'终点 (End)'列合并,得到所有的城市,并将其保存在`cities`集合中。这里使用`set`函数将两列的数据转换为集合,并使用`tolist`函数将集合转换为列表。
然后,使用`load_workbook`函数加载第二个Excel文件,并选择其中的活动工作表。通过遍历工作表的行和列,将数据存储在二维列表`data`中。对于每行数据,通过列表推导式将单元格的值提取出来。
接下来,定义了一个日期变量`date`,用于筛选第一个Excel文件中指定日期的数据。
然后,通过筛选出指定日期的数据,将发货城市、收货城市和快递运输数量存储在名为`data1`的列表中。这里使用`zip`函数将三个列的数据打包成元组,并使用`list`函数将结果转换为列表。
接下来,创建一个有向图对象`G`,并根据第二个Excel文件中的数据添加节点和带权重的边。使用`add_nodes_from`方法将城市添加为节点,使用`add_weighted_edges_from`方法将起点、终点和权重添加为边。
然后,定义了一个变量`cost`用于存储成本,并通过遍历`data1`中的每个元组进行计算。对于每个元组,依次提取出起始城市、目标城市和货物重量。
在循环中,首先通过调用`dijkstra_path`函数计算从起始城市到目标城市的最短路径,并打印出结果。然后,通过调用`dijkstra_path_length`函数计算最短路径的长度,并根据货物重量计算成本。这里成本的计算方式是:路径长度乘以一个系数(1 + (weight_huo/200)^3)。
最后,将每次循环计算得到的成本累加到`cost`变量中,并打印出最终的成本。
总体来说,这段代码主要是对两个Excel文件中的数据进行处理,并使用Dijkstra算法计算货物运输的成本。
阅读全文