首页Python中两个Excel列数不同，有重复项，怎么合并

Python中两个Excel列数不同，有重复项，怎么合并

时间: 2024-04-16 07:24:04 浏览: 152

如果你有两个列数不同的Excel文件，且存在重复项，想要合并它们，可以使用Python中的pandas库来实现。下面是一个示例代码： ```python import pandas as pd # 读取第一个Excel文件 df1 = pd.read_excel('file1.xlsx') # 读取第二个Excel文件 df2 = pd.read_excel('file2.xlsx') # 合并两个DataFrame，忽略索引 merged_df = pd.concat([df1, df2], ignore_index=True) # 去除重复项 merged_df.drop_duplicates(inplace=True) # 将合并后的数据保存为新的Excel文件 merged_df.to_excel('merged_file.xlsx', index=False) ``` 在上述代码中，首先使用`pd.read_excel`函数读取第一个Excel文件和第二个Excel文件，并将它们分别存储在`df1`和`df2`变量中。然后，使用`pd.concat`函数将这两个DataFrame按行进行合并，得到一个合并后的DataFrame(`merged_df`)。接下来，使用`drop_duplicates`函数去除合并后DataFrame中的重复项。最后，使用`to_excel`函数将合并后的数据保存为一个新的Excel文件。请将代码中的"file1.xlsx"和"file2.xlsx"替换为你要合并的两个Excel文件的路径和名称，将"merged_file.xlsx"替换为你想要保存合并后数据的Excel文件的路径和名称。需要注意的是，合并的两个Excel文件在列数上可以不一样，但合并后的结果会包含所有列。如果有重复项，使用`drop_duplicates`函数可以去除重复的行。

阅读全文