易企僵尸企业分类系统:机器学习与Web可视化

需积分: 46 8 下载量 163 浏览量 更新于2024-12-15 3 收藏 6.6MB ZIP 举报
资源摘要信息:"易企|僵尸企业分类系统是一套用于识别和分类僵尸企业的机器学习解决方案,该方案在2020年第十一届中国大学生服务外包创新创业大赛中被提交。系统的核心功能是通过机器学习模型对给定的企业信息进行二分类,判断企业是否为僵尸企业。 该系统可以分为两个主要部分: 第一部分是机器学习训练模型。在这个部分,团队使用了决策树、随机森林和XGBoost算法来构建分类器。为了提高模型的性能,他们采用了递归特征消除交叉验证(RFECV)方法进行特征选择,并使用网格搜索进行五折交叉验证的参数调优。此外,项目还采用了投票分类器方法来结合不同算法的结果。在投票分类器中,不同模型的权重是通过遗传算法优化的。这种方法利用了遗传算法的全局搜索能力,以确定最优权重分配,从而进一步增强模型分类的准确性。 第二部分是Web可视化界面,它使用了Bootstrap、Django和PyEcharts技术栈来实现。这个界面允许用户通过拆分或批量的方式输入企业信息,并实时显示分类结果。此外,界面还提供了企业信息的可视化展示,使用户能够直观地了解数据。 系统的使用环境要求是Python版本至少为3.7,依赖的库包括Pandas、Scikit-learn等。Pandas库用于数据处理,而Scikit-learn提供了构建机器学习模型所需的算法和工具。此外,系统还依赖于其他几个库,如脾气暴躁、作业库、matplotlib等,这些库各有其专门的用途,例如数据可视化、数据处理和统计分析。 整个系统的开发强调了机器学习模型的构建和Web前端界面的交互性,使得最终用户可以轻松地使用Web界面上传数据,并获得僵尸企业分类的反馈。系统开源的标签表明开发者将源代码公开,以便于其他开发者或组织可以根据需要进行进一步的改进、扩展或定制。 文件压缩包中包含的文件名称列表为YiQi-ZombieCompanyClassifier-master,暗示了包含在该压缩包中的是主版本的源代码,用户可以基于这些源代码进行学习、研究或者二次开发。"