首页python处理两个excel中列中有相同信息，信息不必完全相同，则保存

python处理两个excel中列中有相同信息，信息不必完全相同，则保存

时间: 2024-03-08 12:46:57 浏览: 43

您好！对于您的问题，可以使用Python中的pandas库来读取和处理Excel文件。具体步骤如下： 1. 使用pandas库的read_excel()函数读取两个Excel文件，将数据存储在两个DataFrame对象中。 2. 使用str.contains()函数判断第一个Excel文件中的某一列数据是否包含第二个Excel文件中的某一列数据，得到一个布尔型的Series对象。 3. 使用Series对象的loc()函数选取满足条件的数据所在的行，得到一个新的DataFrame对象。 4. 最后，使用to_excel()函数将新的DataFrame对象保存为Excel文件。下面是示例代码： ```python import pandas as pd # 读取两个Excel文件 df1 = pd.read_excel("your_file1_name.xlsx") df2 = pd.read_excel("your_file2_name.xlsx") # 判断第一个Excel文件中的某一列数据是否包含第二个Excel文件中的某一列数据 mask = df1["列1"].str.contains("|".join(df2["列2"].tolist())) # 选取满足条件的数据所在的行 new_df = df1.loc[mask] # 保存为Excel文件 new_df.to_excel("new_file.xlsx", index=False) ``` 其中，"your_file1_name.xlsx"和"your_file2_name.xlsx"分别为两个要处理的Excel文件名；"列1"为第一个Excel文件中要判断的列名，"列2"为第二个Excel文件中要判断的列名；"new_file.xlsx"为保存满足条件的数据的Excel文件名。希望能够帮助到您！

阅读全文