Python自动化统计:疫情期间班级打卡与信息异常排查

4 下载量 155 浏览量 更新于2024-08-29 2 收藏 2.12MB PDF 举报
在疫情期间,为了提高效率并减轻辅导员和班长的工作负担,作者利用Python编程语言中的pandas库来辅助统计班级的打卡信息。本文主要介绍了如何通过Python处理两个关键功能产生的数据,即“每日一报”和“i签到”,以解决手动筛选和通知过程中存在的繁琐问题。 首先,文章概述了背景情况,学校为了应对疫情,开发了线上打卡系统,辅导员需要频繁地从学工系统导出数据,这是一项耗时且易出错的任务。作者通过以下步骤实现自动化统计: 1. **初步打卡情况简介**: 描述了初期手动处理的困难,包括大量时间投入、信息筛选错误以及学生乱填乱写的问题。这促使作者决定引入Python,以简化工作流程。 2. **pandas导入数据**: - 通过`pandas`库导入Excel数据,例如`data1 = pd.read_excel('./data/测试/每日一报.xlsx')`,实现了对《每日一报》打卡表格的读取。 - `data1`变量存储了导入的数据,通过`.col`属性查看数据列,这是数据分析的基础步骤。 3. **查看数据与形状**: 在导入数据后,作者会检查数据的基本结构,包括查看数据的前几行、列名和基本信息,以确保数据正确无误。`data.shape`用于了解数据集的大小(行数和列数)。 4. **每日一报未打卡人数统计**: - 通过分析数据,识别出未打卡的学生,可能是通过比较实际学生数量和打卡记录的数量,找出缺失的记录。 - 提取未打卡同学列表,这部分可能涉及数据清洗和条件过滤操作。 5. **查找打卡信息异常同学**: - 通过计算众数或特定字段的异常值来识别填写错误或异常信息的同学。 - 标注需要审核的表头,方便后续人工审查。 - 提取特定异常同学的数据。 6. **查找体温异常**: - 对体温数据进行预处理,可能包括缺失值处理、数据类型转换等。 - 检查是否有学生未填写体温,或体温值超出正常范围。 7. **可视化与图表制作**: - 使用`cpca`库进行数据分析和可视化,如绘制打卡分布图,通过图表形式呈现数据分布,便于快速理解数据情况。 - 不仅关注省级数据,还可能根据需求添加自定义地点进行比较。 8. **代码汇总与分享**: 文章最后提供了所有相关代码的汇总,以便读者理解和复用。 这篇文章展示了如何利用Python和pandas库有效地处理疫情期间的班级打卡数据,提高了工作效率,减少了人工错误,对于其他面临类似问题的教育机构或个人具有实用价值。