pandas用for循环获取全部的行数据并对比两列数据是否一致,分别导致列数据一致的行和不一致的行
时间: 2023-09-05 20:07:07 浏览: 319
可以使用以下代码来实现:
```python
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
# 初始化两个列表,用于存储一致和不一致的行
same_rows = []
different_rows = []
# 遍历每一行
for index, row in df.iterrows():
# 获取两列数据的值
col1 = row['column1']
col2 = row['column2']
# 判断两列数据是否一致
if col1 == col2:
same_rows.append(row)
else:
different_rows.append(row)
# 将一致和不一致的行转换为DataFrame格式并导出为csv文件
same_df = pd.DataFrame(same_rows)
same_df.to_csv('same_rows.csv', index=False)
different_df = pd.DataFrame(different_rows)
different_df.to_csv('different_rows.csv', index=False)
```
其中,`data.csv`是原始数据文件,`column1`和`column2`是需要对比的两列数据。将一致和不一致的行分别存储在`same_rows`和`different_rows`列表中,最后将它们转换为DataFrame格式并导出为csv文件。
阅读全文