优化少数类误分代价的折中分类性能设计
需积分: 0 122 浏览量
更新于2024-09-08
收藏 512KB PDF 举报
"这篇论文‘折中规划分类性能的少数类误分代价优化设计’探讨了在处理类不平衡问题时,如何通过优化代价敏感方法来提升分类性能。作者提出了一个新的因子量化方法,该方法以分类性能需求为导向,用以优化代价。论文中,分类性能需求被表示为与代价因子相关的正负类分类性能指标函数。通过遗传算法在预设的值域内寻找最优代价因子,并将此最优因子应用于代价敏感的Boosting学习方法,构建基于特定分类性能的分类模型。实验中,选择了C4.5和ZeroR作为基算法,在不同样本集上进行建模,结果显示,使用优化后的代价因子,分类器在真正例(TP)和真负例(TN)上的表现有了显著改进,实现了更均衡的分类性能。"
这篇研究论文聚焦于类不平衡问题,其中的挑战在于传统的代价敏感方法通常基于类别样本数量来设定代价。作者靳燕和彭新光提出了一种创新的优化策略,他们设计了一个新的量化方法,将分类性能需求转化为与代价因子相关的性能指标函数。这个性能指标函数考虑了正类和负类的分类效果,从而为代价优化提供了依据。
论文采用遗传算法,这是一种基于生物进化原理的全局优化工具,能够在给定的性能表达式下搜索最佳代价参数。这个最佳代价因子随后被引入到代价敏感Boosting算法中,以创建一个更加适应特定分类性能需求的分类模型。
实验部分,研究人员选择了C4.5决策树和ZeroR作为基础分类器,并在不同的数据集上进行分类建模。结果显示,通过优化代价因子,基于C4.5和ZeroR的分类器在真正例率和真负例率上有显著改善。具体来说,C4.5分类器的真正例率提高了33.3%至200%,而真负例率则在[-49%~-15.6%]之间变化,表明正类误判情况得到改善,同时没有加剧负类误判。对于ZeroR,负类误判的改善更为明显,而正类召回率始终保持在0.5以上,确保了分类性能的均衡。
这项研究通过优化代价敏感学习的代价因子,有效地提升了处理类不平衡问题时的分类性能,尤其是在减少少数类误分类方面取得了积极成果。这种方法对于那些在医疗诊断、金融风险评估等对误分类代价敏感的领域具有重要的应用价值。
134 浏览量
195 浏览量
2019-07-22 上传
107 浏览量
2019-07-22 上传

weixin_38743968
- 粉丝: 404
最新资源
- Web远程教学系统需求分析指南
- 禅道6.2版本发布,优化测试流程,提高安全性
- Netty传输层API中文文档及资源包免费下载
- 超凡搜索:引领搜索领域的创新神器
- JavaWeb租房系统实现与代码参考指南
- 老冀文章编辑工具v1.8:文章编辑的自动化解决方案
- MovieLens 1m数据集深度解析:数据库设计与电影属性
- TypeScript实现tca-flip-coins模拟硬币翻转算法
- Directshow实现多路视频采集与传输技术
- 百度editor实现无限制附件上传功能
- C语言二级上机模拟题与VC6.0完整版
- A*算法解决八数码问题:AI领域的经典案例
- Android版SeetaFace JNI程序实现人脸检测与对齐
- 热交换器效率提升技术手册
- WinCE平台CPU占用率精确测试工具介绍
- JavaScript实现的压缩包子算法解读