用pandas将一个表中同一个房屋坐落两个不同的账号的流水做比较
时间: 2024-03-05 20:47:42 浏览: 49
可以按照房屋地址进行分组,然后再将每个分组内的账号进行两两匹配比较。可以使用pandas的groupby和merge方法来实现。
假设表格中有三列:房屋地址、账号、流水。代码示例如下:
```python
import pandas as pd
# 读取表格
df = pd.read_csv('data.csv')
# 按照房屋地址分组
groups = df.groupby('房屋地址')
# 遍历每个分组
for name, group in groups:
# 对分组内的账号进行两两匹配比较
merged = pd.merge(group, group, on='账号')
# 去除重复的行和同一账号的比较
merged = merged[merged['流水_x'] != merged['流水_y']]
merged = merged.drop_duplicates(subset=['账号', '流水_x', '流水_y'])
# 输出比较结果
print(f'房屋地址:{name}')
print(merged)
```
在上述代码中,我们首先按照房屋地址进行了分组。然后对于每个分组,我们使用merge方法将该分组内的账号进行两两匹配比较,并将比较结果输出。需要注意的是,我们需要去除重复的行和同一账号的比较。
相关问题
用pandas在Excel表中同一个房屋坐落对应两个不同的房屋账号,用两个账号匹配流水词条
可以使用pandas的merge方法来实现在Excel表中同一个房屋坐落对应两个不同的房屋账号,用两个账号匹配流水词条。具体步骤如下:
1. 使用pandas分别读取房屋账号表格和流水表格,假设房屋账号表格的文件名为accounts.xlsx,包含三列:房屋地址、第一个账号、第二个账号;流水表格的文件名为transactions.xlsx,包含四列:房屋地址、账号、流水词条、流水金额。代码示例如下:
```python
import pandas as pd
# 读取房屋账号表格
accounts = pd.read_excel('accounts.xlsx')
# 读取流水表格
transactions = pd.read_excel('transactions.xlsx')
```
2. 使用pandas的merge方法,将房屋账号表格和流水表格进行合并。由于同一个房屋坐落对应两个不同的房屋账号,需要进行两次合并,分别以第一个账号和第二个账号作为键。代码示例如下:
```python
# 以第一个账号作为键合并
merged1 = pd.merge(transactions, accounts[['房屋地址', '第一个账号']], on='房屋地址', how='left')
merged1 = pd.merge(merged1, transactions[['房屋地址', '流水词条']], left_on=['房屋地址', '第一个账号'], right_on=['房屋地址', '账号'], how='left')
merged1 = merged1[['房屋地址', '第一个账号', '流水词条']]
merged1.columns = ['房屋地址', '账号', '流水词条']
# 以第二个账号作为键合并
merged2 = pd.merge(transactions, accounts[['房屋地址', '第二个账号']], on='房屋地址', how='left')
merged2 = pd.merge(merged2, transactions[['房屋地址', '流水词条']], left_on=['房屋地址', '第二个账号'], right_on=['房屋地址', '账号'], how='left')
merged2 = merged2[['房屋地址', '第二个账号', '流水词条']]
merged2.columns = ['房屋地址', '账号', '流水词条']
# 合并两次合并的结果
merged = pd.concat([merged1, merged2])
```
在上述代码中,我们首先以第一个账号作为键合并,将流水表格和房屋账号表格进行合并,并仅保留房屋地址、第一个账号和流水词条三列。然后以第二个账号作为键进行合并,同样仅保留房屋地址、第二个账号和流水词条三列。最后,将两次合并的结果进行合并,得到最终的合并结果。
3. 对合并结果进行筛选,按照房屋地址和账号进行筛选,即可得到对应的流水词条。代码示例如下:
```python
# 筛选结果
result = merged[(merged['房屋地址'] == 'xxx') & ((merged['账号'] == 'xxx') | (merged['账号'] == 'xxx'))]['流水词条']
```
在上述代码中,我们使用了布尔索引,按照房屋地址和账号进行筛选,得到对应的流水词条。需要将代码中的'xxx'替换为具体的房屋地址和账号。
一个Excel表中同一个房屋坐落对应两个不同的房屋账号,用pandas对两个不同的账号匹配流水表
好的,你的问题是如何用 pandas 对两个不同的账号匹配流水表。
首先,我们可以将 Excel 表中的数据读入 pandas 的 DataFrame 中。然后,我们可以使用 DataFrame 的 merge() 函数将两个账号的流水表合并为一个表,并且使用 groupby() 函数按照房屋坐落和账号进行分组,再使用 sum() 函数对每个组进行求和,得到每个账号在每个房屋坐落的总流水。
以下是示例代码:
``` python
import pandas as pd
# 读入 Excel 表中的数据到 DataFrame
df_account1 = pd.read_excel('account1.xlsx')
df_account2 = pd.read_excel('account2.xlsx')
df_flow = pd.read_excel('flow.xlsx')
# 将两个账号的流水表合并为一个表
df_merged = pd.merge(df_account1, df_account2, on='房屋坐落')
# 按照房屋坐落和账号进行分组,对每个组进行求和
df_total_flow = df_flow.groupby(['房屋坐落', '账号']).sum()
# 输出每个账号在每个房屋坐落的总流水
print(df_total_flow)
```
注意,这里的代码仅仅是一个示例,实际应用中需要根据具体情况进行修改。同时,为了保护您的隐私,示例代码中的文件名和文件路径均为假设值,实际应用中需要根据实际情况进行修改。
阅读全文