Python中两个Excel列数不同,有重复项,怎么合并
时间: 2024-04-16 15:24:04 浏览: 139
如果你有两个列数不同的Excel文件,且存在重复项,想要合并它们,可以使用Python中的pandas库来实现。下面是一个示例代码:
```python
import pandas as pd
# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')
# 合并两个DataFrame,忽略索引
merged_df = pd.concat([df1, df2], ignore_index=True)
# 去除重复项
merged_df.drop_duplicates(inplace=True)
# 将合并后的数据保存为新的Excel文件
merged_df.to_excel('merged_file.xlsx', index=False)
```
在上述代码中,首先使用`pd.read_excel`函数读取第一个Excel文件和第二个Excel文件,并将它们分别存储在`df1`和`df2`变量中。然后,使用`pd.concat`函数将这两个DataFrame按行进行合并,得到一个合并后的DataFrame(`merged_df`)。接下来,使用`drop_duplicates`函数去除合并后DataFrame中的重复项。最后,使用`to_excel`函数将合并后的数据保存为一个新的Excel文件。
请将代码中的"file1.xlsx"和"file2.xlsx"替换为你要合并的两个Excel文件的路径和名称,将"merged_file.xlsx"替换为你想要保存合并后数据的Excel文件的路径和名称。
需要注意的是,合并的两个Excel文件在列数上可以不一样,但合并后的结果会包含所有列。如果有重复项,使用`drop_duplicates`函数可以去除重复的行。
阅读全文