编写一个比对excel两个sheet页的数据差异
时间: 2024-04-15 10:29:56 浏览: 247
下面是一个示例代码,用于比对两个 Excel 文件中两个 sheet 页的数据差异:
```python
import pandas as pd
def compare_excel_sheets(file1, sheet1, file2, sheet2):
# 读取 Excel 文件
df1 = pd.read_excel(file1, sheet_name=sheet1)
df2 = pd.read_excel(file2, sheet_name=sheet2)
# 比对两个 sheet 页的数据差异
diff = pd.concat([df1, df2]).drop_duplicates(keep=False)
return diff
# 指定要比对的 Excel 文件和 sheet 页
file1 = 'file1.xlsx'
sheet1 = 'Sheet1'
file2 = 'file2.xlsx'
sheet2 = 'Sheet2'
# 调用函数比对数据差异
result = compare_excel_sheets(file1, sheet1, file2, sheet2)
# 打印差异数据
print(result)
```
以上代码使用了 `pandas` 库来读取和处理 Excel 文件。`pd.read_excel()` 函数用于读取 Excel 文件中的指定 sheet 页数据,并返回一个 DataFrame 对象。然后,通过 `pd.concat()` 函数将两个 DataFrame 连接起来,并使用 `drop_duplicates()` 函数找到两个 DataFrame 中不同的数据行。
请将 `'file1.xlsx'`、`'Sheet1'`、`'file2.xlsx'` 和 `'Sheet2'` 替换为你实际的 Excel 文件路径和 sheet 页名称。运行代码后,会输出两个 sheet 页中不同的数据行。你可以根据需求对代码进行修改,实现更多自定义的功能,例如输出差异行的具体位置或保存差异数据到新的 Excel 文件中。
阅读全文