#将三节课迟到的迟到名单合并到一个excle表格中 df41.to_excel('late_members1-3.xlsx', index=False) # 定义一个匹配函数 def match(name, choices): return process.extractOne(name, choices, scorer=fuzz.token_sort_ratio)[0] # 对每个姓名进行匹配，并统计出现次数 counts = df41['用户名称'].groupby(lambda x: match(x, df41['用户名称'])).count().sort_values(ascending=False) # 保存结果为 Excel 表格 counts.to_excel('counts.xlsx', index=True, header=['出现次数'])这段代码怎么改

时间: 2024-01-26 16:04:11 浏览: 78

这段代码是将三节课迟到的名单合并到一个 Excel 表格中，并对每个姓名进行模糊匹配，并统计出现次数，最后将结果保存为 Excel 表格。如果你想要修改这段代码，可以根据具体需求进行相应的修改，例如修改文件名、修改匹配函数、修改统计方式等等。以下是一些可能的修改建议： - 修改文件名：将 "late_members1-3.xlsx" 和 "counts.xlsx" 修改为你想要的文件名。 - 修改匹配函数：如果你不满意当前的匹配函数，可以尝试使用其他的模糊匹配算法，或者自己编写一个匹配函数。比如，你可以使用 difflib 库中的 SequenceMatcher 来计算两个字符串的相似度，然后选择相似度最高的字符串作为匹配结果。具体实现方法可以参考 difflib 库的文档。 - 修改统计方式：如果你想要统计除了出现次数之外的其他信息，比如平均迟到时间、迟到次数分布等等，可以根据具体需求进行相应的修改。你可以使用 pandas 库中的 groupby 和 agg 方法来进行分组统计，或者使用其他的统计工具进行计算。总之，这段代码的修改方式很多，具体要看你的需求是什么。如果你遇到了困难或者需要更具体的帮助，可以提出具体的问题，我会尽力帮助你。

!pip install python-Levenshtein import pandas as pd from fuzzywuzzy import fuzz # 读取Excel数据 df111 = pd.read_excel('late_members1-3.xlsx') # 将中文名字转为拼音 df['pinyin'] = df111['用户名称'].apply(lambda x: lazy_pinyin(x, style=Style.NORMAL)) # 合并相似的名字 for i, row in df.iterrows(): for j in range(i+1, len(df)): if fuzz.ratio(row['pinyin'], df.loc[j, 'pinyin']) > 80: df.loc[j, '用户名称'] = row['用户名称'] # 统计每个名字出现的次数 name_counts = df['用户名称'].value_counts() print(name_counts)这段代码后面加上导出为excle表格

你可以使用pandas中的to_excel()函数将处理后的数据导出为Excel表格。示例代码如下： ```python import pandas as pd from fuzzywuzzy import fuzz # 读取Excel数据 df = pd.read_excel('late_members1-3.xlsx') # 将中文名字转为拼音 df['pinyin'] = df['用户名称'].apply(lambda x: lazy_pinyin(x, style=Style.NORMAL)) # 合并相似的名字 for i, row in df.iterrows(): for j in range(i+1, len(df)): if fuzz.ratio(row['pinyin'], df.loc[j, 'pinyin']) > 80: df.loc[j, '用户名称'] = row['用户名称'] # 统计每个名字出现的次数 name_counts = df['用户名称'].value_counts() # 导出为Excel表格 name_counts.to_excel('name_counts.xlsx', index=False) ``` 这段代码将处理后的名字出现次数统计结果导出为一个不带索引的Excel表格，文件名为name_counts.xlsx。

import pandas as pd from fuzzywuzzy import fuzz, process # 读取两个表格 df1 = pd.read_excel('table1.xlsx') df2 = pd.read_excel('table2.xlsx') # 将姓名列转换为字符串类型 df1['姓名'] = df1['姓名'].astype(str) df2['姓名'] = df2['姓名'].astype(str) # 合并姓名列 names = pd.concat([df1['姓名'], df2['姓名']]) # 定义一个匹配函数 def match(name, choices): return process.extractOne(name, choices, scorer=fuzz.token_sort_ratio)[0] # 对每个姓名进行匹配，并统计出现次数 counts = names.groupby(lambda x: match(x, names)).count().sort_values(ascending=False) # 保存结果为 Excel 表格 counts.to_excel('counts.xlsx')在后面显示保存的excle表格

好的，您可以在代码最后添加以下代码来打开保存的 Excel 表格： ```python import os # 获取当前工作目录 cwd = os.getcwd() # 打开保存的 Excel 表格 os.startfile(cwd + '/counts.xlsx') ``` 完整代码如下： ```python import pandas as pd from fuzzywuzzy import fuzz, process import os # 读取两个表格 df1 = pd.read_excel('table1.xlsx') df2 = pd.read_excel('table2.xlsx') # 将姓名列转换为字符串类型 df1['姓名'] = df1['姓名'].astype(str) df2['姓名'] = df2['姓名'].astype(str) # 合并姓名列 names = pd.concat([df1['姓名'], df2['姓名']]) # 定义一个匹配函数 def match(name, choices): return process.extractOne(name, choices, scorer=fuzz.token_sort_ratio)[0] # 对每个姓名进行匹配，并统计出现次数 counts = names.groupby(lambda x: match(x, names)).count().sort_values(ascending=False) # 保存结果为 Excel 表格 counts.to_excel('counts.xlsx') # 获取当前工作目录 cwd = os.getcwd() # 打开保存的 Excel 表格 os.startfile(cwd + '/counts.xlsx') ``` 执行完毕后会自动打开保存的 Excel 表格。

阅读全文

相关推荐

python把大文件txt导进excle.zip_.txt excel_DL4_excel txt_python excle

java-excel.rar_excel java_java excel_java excle_java语言 excel

Read-data-in-Excel.zip_excel labview_labview excel数据_labview exc

用python将一个excle表格中的用户昵称与另一个excle表格中的用户名称合并在一起

from turtle import pd df = pd.read_excel('门店信息模板.xlsx') df.to_csv(r'C:\Users\cxx01273962\Desktop\py\Tools\TESE_EXCLE\门店.csv', index=False, encoding='utf-8')

pandas.read_excel如果excle文件不存在会报错吗？

用python将三个excle表格的姓名列单独合并，并且模糊统计每个姓名出现的次数

一个excle文件中有两个子表格，怎么利用python将他们合并

如何用python将两个excle表格中的用户昵称（入会昵称）与用户名称合并在一起

一个excle文件中有两个子表格，他们的行索引相同，怎么利用python将他们合并

用python写一个合并文件夹data中excle表格的代码

用python将两个excle表格的名称列合并，并且模糊统计每个名称出现的次数

matlab中将3个4*1的值汇总到同一个excle中

matlab中将3个循环的结果，每个循环输出一个4*1的矩阵值，汇总到同一个excle中

如何实现将excle表中数据抽取到另外一张excle表格中

用python将两个带有多个名称的excle表格合并，并且模糊统计每个名称出现的次数

python读取excle中的数据后，将其中1，3，5列转化为转化为一个列表

pd.read_excle读取时如何设置单元格宽度

大家在看

水利 SWMM PEST++ 自动率定

批量标准矢量shp互转txt工具

测量变频损耗L的方框图如图-所示。-微波电路实验讲义

安装向导-pro／engineer野火版5.0完全自学一本通

中南大学943数据结构1997-2020真题&解析

最新推荐

excel表格的电话号码怎么才能直接点击拨打电话.docx

VBS实现将Excel表格保存为txt文本

Android开发实现的导出数据库到Excel表格功能【附源码下载】

Termux (Android 5.0+).apk.cab

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布

"互动学习：行动中的多样性与论文攻读经历"