python处理两个excel中的某列，他们的列名不同，列中单元格包含有相似信息，其他信息不必完全相同，则保存

您好，感谢您的提问。根据您的问题描述，您需要处理两个Excel表格中的某一列数据，这些列的列名不同，但包含相似的信息，同时这些信息所在的单元格可能包含其他不同的信息。您需要将两个表格中包含相似信息的行保存下来。可以使用Python中的pandas库和模糊匹配算法（例如模糊字符串匹配算法）来完成这个任务。具体步骤如下： 1. 使用pandas库的read_excel方法读取两个Excel表格中的数据，并将它们存储到两个DataFrame对象中。 2. 使用模糊匹配算法（例如模糊字符串匹配算法）比较两个DataFrame对象中的某一列数据，找出相似的信息，并将结果保存到一个新的DataFrame对象中。 3. 在新的DataFrame对象中，删除不需要的列，并将结果保存到一个新的Excel表格中。下面是一个示例代码，假设第一个Excel表格的列名为"Column1"，第二个Excel表格的列名为"Column2"，您需要查找包含相似字符串的行并保存结果到一个新的Excel表格中。 ```python import pandas as pd from fuzzywuzzy import process # 读取两个Excel表格中的数据 df1 = pd.read_excel("excel1.xlsx") df2 = pd.read_excel("excel2.xlsx") # 比较两个DataFrame对象中的某一列数据，找出相似的信息 merged_data = [] for row1 in df1.itertuples(): for row2 in df2.itertuples(): similarity = process.extract(row1.Column1, [row2.Column2], limit=1) if similarity[0][1] > 90: merged_data.append(row1 + row2) # 将匹配结果保存到一个新的DataFrame对象中 merged_df = pd.DataFrame(merged_data, columns=list(df1.columns) + list(df2.columns)) # 删除不需要的列 merged_df = merged_df.drop(columns=['OtherColumn1', 'OtherColumn2']) # 将结果保存到一个新的Excel表格中 merged_df.to_excel("result.xlsx", index=False) ``` 注意，上述代码中的字符串匹配算法使用了fuzzywuzzy库中的process.extract方法，其中的90是匹配分数的阈值，您可以根据实际情况调整阈值。同时，如果两个Excel表格中的信息所在列包含其他类型的数据（例如数字、日期等），您需要将代码中的"Column1"和"Column2"替换成实际的列名，并根据需要修改模糊匹配算法的参数。

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通

python处理两个excel中的某列，他们的列名不同，列中单元格包含有相似信息，其他信息不必完全相同，则保存

最新推荐

python判断两个列表中相同和不同的元素

利用python对excel中一列的时间数据更改格式操作

python操作openpyxl导出Excel 设置单元格格式及合并处理代码实例

python筛选出两个文件中重复行的方法

使用Python向DataFrame中指定位置添加一列或多列的方法

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

用 Python 画一个可以动的爱心

JSBSim Reference Manual