python处理两个excel中,列名不同,列中单元格包含有相同数字,其他信息不必完全相同,则保存

时间: 2024-01-12 21:05:31 浏览: 24
好的,您的问题是如何用 Python 处理两个 Excel 文件,找到其中列中单元格包含有相同数字,其他信息不必完全相同的行,即使列名不同,也能进行比较,然后将这些行保存下来。 下面是一个可以实现这个功能的 Python 代码示例,需要使用 pandas 和 openpyxl 库: ```python import pandas as pd import numpy as np # 读取两个 Excel 文件 df1 = pd.read_excel('file1.xlsx') df2 = pd.read_excel('file2.xlsx') # 查找共同的列 common_cols = list(set(df1.columns) & set(df2.columns)) # 按照共同的列进行内连接 df_merge = pd.merge(df1, df2, on=common_cols, how='inner') # 循环遍历需要比较的列 compare_cols = ['需要比较的列名1', '需要比较的列名2'] for col in compare_cols: # 在每个单元格中查找是否包含相同数字,并创建一个布尔型的 DataFrame contains_nums = df_merge.filter(regex=col).astype(str).apply(lambda x: any(i.isdigit() for i in x)) # 将布尔型的 DataFrame 转换成 NumPy 数组 np_contains_nums = contains_nums.to_numpy() # 用 NumPy 数组筛选出包含相同数字的行 df_result = df_merge[np_contains_nums] # 将结果保存为新的 Excel 文件 df_result.to_excel(f'result_{col}.xlsx', index=False) ``` 需要注意的是,上述代码中的“需要比较的列名1”和“需要比较的列名2”需要根据实际情况进行修改,以对应实际的 Excel 文件中的列名。另外,代码中使用了循环遍历的方法,可以通过修改 `compare_cols` 列表中的元素,来比较多个列中是否包含相同数字。

最新推荐

recommend-type

python判断两个列表中相同和不同的元素

1 #接⼝返回值 2 list1 = ['张三', '李四', '王五', '⽼⼆'] 3 #数据库返回值 4 list2 = ['张三', '李四', '⽼⼆', '王七'] ...7 b = [y for y in (list1 + list2) if y not in a] #两个列表中的不同元素
recommend-type

python操作openpyxl导出Excel 设置单元格格式及合并处理代码实例

主要介绍了python操作openpyxl导出Excel 设置单元格格式及合并处理代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
recommend-type

python筛选出两个文件中重复行的方法

主要为大家详细介绍了python筛选出两个文件中重复行的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
recommend-type

python之DataFrame实现excel合并单元格

主要为大家详细介绍了python之DataFrame实现excel合并单元格,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
recommend-type

python实现PDF中表格转化为Excel的方法

主要为大家详细介绍了python实现PDF中表格转化为Excel的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

spring添加xml配置文件

1. 创建一个新的Spring配置文件,例如"applicationContext.xml"。 2. 在文件头部添加XML命名空间和schema定义,如下所示: ``` <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.springframework.org/schema/beans
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。