首页pandas 处理两个EXECL 两个相同列，交叉合并，并且显示出来不同

pandas 处理两个EXECL 两个相同列，交叉合并，并且显示出来不同

时间: 2024-09-29 16:11:55 浏览: 76

在pandas中处理两个Excel文件并进行交叉合并，通常涉及读取Excel数据、合并数据、然后筛选出不同的行。以下是基本步骤： 1. **导入pandas库**：首先，你需要导入pandas库，它是Python中用于数据分析的重要工具。 ```python import pandas as pd ``` 2. **读取Excel文件**：使用`read_excel`函数分别读取两个Excel文件，假设它们分别是file1.xlsx和file2.xlsx，都有相同的列名（例如：'Column1', 'Column2'等）。 ```python df1 = pd.read_excel('file1.xlsx') df2 = pd.read_excel('file2.xlsx') ``` 3. **合并数据**：使用`pd.merge`或`concat`函数根据相同的列名进行合并，这里以`merge`为例，选择`inner`连接类型保留共同的行。 ```python merged_df = pd.merge(df1, df2, on=['Column1', 'Column2'], how='inner') ``` 4. **找出差异**：通过比较合并后的DataFrame `merged_df`，你可以找到那些只在一个文件中出现的行，即去重并查看缺失值。 ```python unique_rows = merged_df.drop_duplicates(subset=['Column1', 'Column2']) differences = unique_rows[~unique_rows.duplicated(keep=False)] ``` 5. **显示结果**：最后，展示不同部分的数据。 ```python print(differences) ```

阅读全文