用Python计算Excel中三组数据的曼哈顿距离

假设Excel中三组数据分别为A1:A5、B1:B5、C1:C5，可以使用Pandas库读取Excel数据，并使用numpy库计算曼哈顿距离。代码如下： ```python import pandas as pd import numpy as np # 读取Excel数据 df = pd.read_excel('data.xlsx') # 提取三组数据 A = df['A'].values B = df['B'].values C = df['C'].values # 计算曼哈顿距离 dist_AB = np.sum(np.abs(A - B)) dist_AC = np.sum(np.abs(A - C)) dist_BC = np.sum(np.abs(B - C)) print('曼哈顿距离AB：', dist_AB) print('曼哈顿距离AC：', dist_AC) print('曼哈顿距离BC：', dist_BC) ``` 其中，np.abs()函数用于计算绝对值，np.sum()函数用于计算数组元素的和。运行代码后，会输出三组数据的曼哈顿距离。

# 导入pandas库 import pandas as pd # 读取excel文件的两个sheet sheet1 = pd.read_excel("对照组.xlsx", sheet_name="idle_transition_probability") sheet2 = pd.read_excel("对照组.xlsx", sheet_name="hexagon_grid_table") # 把sheet转换成字典列表 sheet1 = sheet1.to_dict(orient="records") sheet2 = sheet2.to_dict(orient="records") # 创建一个空的字典，用来存储区域id和坐标的对应关系 area_dict = {} # 选择sheet1的第2列和第3列 sheet1 = sheet1.iloc[:, [1, 2]] # 把sheet1的第2列和第3列的数据转换成列表 start_area_list = sheet1.iloc[:, 0].tolist() end_area_list = sheet1.iloc[:, 1].tolist() # 用zip函数把两个列表组合成一个迭代器 area_pairs = zip(start_area_list, end_area_list) # 用for循环遍历每一对上下车地点所在区域的id for start_area, end_area in area_pairs: # 根据id从字典中获取对应的坐标 start_coord = area_dict[start_area] end_coord = area_dict[end_area] # 遍历sheet2，把区域id作为键，坐标作为值，存入字典中 for row in sheet2: area_id = row["格子ID"] longitude = row["中心经度"] latitude = row["中心维度"] area_dict[area_id] = (longitude, latitude) # 创建一个空的列表，用来存储每个时间段的曼哈顿距离 distance_list = [] # 计算两个坐标之间的x轴距离和y轴距离 x_distance = abs(end_coord[0] - start_coord[0]) y_distance = abs(end_coord[1] - start_coord[1]) # 计算两个坐标之间的曼哈顿距离，并添加到列表中 manhattan_distance = x_distance + y_distance distance_list.append(manhattan_distance) # 创建一个空的DataFrame df = pd.DataFrame() # 把列表添加到DataFrame中，指定列名 df["曼哈顿距离"] = distance_list # 把DataFrame保存到Excel文件中，指定文件名和sheet名 df.to_excel("result.xlsx", sheet_name="result")请你帮我修改一下

好的，以下是修改后的代码： ```python # 导入pandas库 import pandas as pd # 读取excel文件的两个sheet sheet1 = pd.read_excel("对照组.xlsx", sheet_name="idle_transition_probability") sheet2 = pd.read_excel("对照组.xlsx", sheet_name="hexagon_grid_table") # 把sheet转换成字典列表 sheet1 = sheet1.to_dict(orient="records") sheet2 = sheet2.to_dict(orient="records") # 创建一个空的字典，用来存储区域id和坐标的对应关系 area_dict = {} # 选择sheet1的第2列和第3列 sheet1 = pd.DataFrame(sheet1, columns=["start_area", "end_area"]) # 把sheet1的第2列和第3列的数据转换成列表 start_area_list = sheet1["start_area"].tolist() end_area_list = sheet1["end_area"].tolist() # 用zip函数把两个列表组合成一个迭代器 area_pairs = zip(start_area_list, end_area_list) # 遍历sheet2，把区域id作为键，坐标作为值，存入字典中 for row in sheet2: area_id = row["格子ID"] longitude = row["中心经度"] latitude = row["中心维度"] area_dict[area_id] = (longitude, latitude) # 创建一个空的列表，用来存储每个时间段的曼哈顿距离 distance_list = [] # 用for循环遍历每一对上下车地点所在区域的id for start_area, end_area in area_pairs: # 根据id从字典中获取对应的坐标 start_coord = area_dict[start_area] end_coord = area_dict[end_area] # 计算两个坐标之间的x轴距离和y轴距离 x_distance = abs(end_coord[0] - start_coord[0]) y_distance = abs(end_coord[1] - start_coord[1]) # 计算两个坐标之间的曼哈顿距离，并添加到列表中 manhattan_distance = x_distance + y_distance distance_list.append(manhattan_distance) # 创建一个空的DataFrame df = pd.DataFrame() # 把列表添加到DataFrame中，指定列名 df["曼哈顿距离"] = distance_list # 把DataFrame保存到Excel文件中，指定文件名和sheet名 df.to_excel("result.xlsx", sheet_name="result") ``` 主要修改如下： 1. 在读取sheet1后，使用`pd.DataFrame()`方法将其转换为DataFrame，并指定了`columns`参数，这样就可以直接使用列名来引用数据了。 2. 在计算两个坐标之间的曼哈顿距离时，将计算过程放在for循环内部，这样可以计算出每一对上下车地点的距离。 3. 在创建DataFrame时，使用`pd.DataFrame()`方法创建空的DataFrame，然后将数据添加到其中。 4. 在保存DataFrame到Excel文件中时，使用`df.to_excel()`方法，指定了文件名和sheet名。

阅读全文

用Python计算Excel中三组数据的曼哈顿距离

相关推荐

Python在Excel中条件筛选数据的自动化操作指南

Python在Excel数据分析中的应用实践

掌握Excel与Python在数据分析中的应用

Python-使用Python3和scipy作为Jupyter笔记本进行层次聚类练习

【超越Python基础】：abs函数，复杂数据结构的绝对值计算专家

Python数据分析-自测试卷5.docx

python机器学习KNN算法 相关代码

knn.rar_机器学习 KNN python

pythonK近邻算法（k-Nearest Neighbors，KNN）解决分类问题

Python数据挖掘实现睡眠分期SharpWaves电信号分类与分析

Excel实现模糊聚类分析方法探索

KNN算法数据集详细分析与应用

MySQL数据分析实战：从数据中挖掘洞察，赋能业务决策

【多语言聚类视角】：Python与R语言在KMeans算法上的比较与案例分析

曲线形状比较在数据可视化中的重要性：视觉化数据的新视角

【电力系统管理】：数学规划在高维数据聚类中的应用

【心理数据挖掘探索】：SPSS在心理学中的应用实践

【生态数据分析全流程】：从PC-ORD数据清洗到结果输出

数据预处理关键：3步策略提高聚类分析质量，专家推荐指南

大家在看

读写通达信股票软件二进制dat文件

CMOS反相器的掩膜版图-集成电路版图设计

调制解调文档

Windows系统kb2577795-kb2553549 补丁

ISO/IEC 27005:2022 英文原版

最新推荐

使用python将excel数据导入数据库过程详解

利用Python实现Excel的文件间的数据匹配功能

python实现excel读写数据

用Python将Excel数据导入到SQL Server的例子

利用python对excel中一列的时间数据更改格式操作

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

python机器学习KNN算法相关代码