如何利用python找出两个只有一列数据的excel文件中不同的值并将不同的值输出为一列excel文件
时间: 2024-05-06 20:21:28 浏览: 222
python实现查找excel里某一列重复数据并且剔除后打印的方法
5星 · 资源好评率100%
可以使用 Pandas 库中的 read_excel() 函数将两个 Excel 文件读取为两个 DataFrame,然后使用 DataFrame 的 merge() 函数合并两个 DataFrame,并添加一个名为“is_different”的列,该列表示两个 Dataframe 中的对应元素是否相同。然后可以使用筛选器筛选出“is_different”列值为 True 的所有行并输出为一个新的 Excel 文件。以下是示例代码:
```python
import pandas as pd
# 读取两个 Excel 文件
df1 = pd.read_excel('file1.xlsx', index_col=None)
df2 = pd.read_excel('file2.xlsx', index_col=None)
# 合并两个 DataFrame,并添加一个“is_different”列
merged_df = df1.merge(df2, indicator=True, how='outer')
merged_df['is_different'] = merged_df['_merge'] == 'left_only'
# 筛选出“is_different”列值为 True 的所有行
different_df = merged_df[merged_df['is_different'] == True]
# 输出不同的值为一个新的 Excel 文件
different_df.to_excel('different_values.xlsx', index=False)
```
这个代码可以帮助你找出两个只有一列数据的 Excel 文件中不同的值,并将不同的值输出为一个新的 Excel 文件。
阅读全文