import pandas as pd from fuzzywuzzy import fuzz, process # 读取两个表格 df1 = pd.read_excel('table1.xlsx') df2 = pd.read_excel('table2.xlsx') # 将姓名列转换为字符串类型 df1['姓名'] = df1['姓名'].astype(str) df2['姓名'] = df2['姓名'].astype(str) # 合并姓名列 names = pd.concat([df1['姓名'], df2['姓名']]) # 定义一个匹配函数 def match(name, choices): return process.extractOne(name, choices, scorer=fuzz.token_sort_ratio)[0] # 对每个姓名进行匹配,并统计出现次数 counts = names.groupby(lambda x: match(x, names)).count().sort_values(ascending=False) # 保存结果为 Excel 表格 counts.to_excel('counts.xlsx')在后面显示保存的excle表格
时间: 2023-12-29 20:04:26 浏览: 152
好的,您可以在代码最后添加以下代码来打开保存的 Excel 表格:
```python
import os
# 获取当前工作目录
cwd = os.getcwd()
# 打开保存的 Excel 表格
os.startfile(cwd + '/counts.xlsx')
```
完整代码如下:
```python
import pandas as pd
from fuzzywuzzy import fuzz, process
import os
# 读取两个表格
df1 = pd.read_excel('table1.xlsx')
df2 = pd.read_excel('table2.xlsx')
# 将姓名列转换为字符串类型
df1['姓名'] = df1['姓名'].astype(str)
df2['姓名'] = df2['姓名'].astype(str)
# 合并姓名列
names = pd.concat([df1['姓名'], df2['姓名']])
# 定义一个匹配函数
def match(name, choices):
return process.extractOne(name, choices, scorer=fuzz.token_sort_ratio)[0]
# 对每个姓名进行匹配,并统计出现次数
counts = names.groupby(lambda x: match(x, names)).count().sort_values(ascending=False)
# 保存结果为 Excel 表格
counts.to_excel('counts.xlsx')
# 获取当前工作目录
cwd = os.getcwd()
# 打开保存的 Excel 表格
os.startfile(cwd + '/counts.xlsx')
```
执行完毕后会自动打开保存的 Excel 表格。
阅读全文