随机森林特征选择法提升软件缺陷预测
需积分: 9 42 浏览量
更新于2024-09-06
收藏 775KB PDF 举报
本篇论文《软件缺陷预测中的特征选择方法:一种基于随机森林的策略》由李梦奇、秦素娟两位作者共同撰写,发表在 StateKeyLaboratoryofNetworkingandSwitchingTechnology 的北京邮电大学。论文旨在解决软件缺陷预测中常见的特征维度过大问题。传统的缺陷预测模型往往需要处理大量的特征,这可能导致模型复杂度增加,预测性能下降。
作者们提出了一种新颖的特征子集选择方法,该方法以随机森林作为核心。他们对特征的重要性进行了量化评估,特别关注于第一个特征的选择,通过简化这个过程并改良了向前搜索策略。这种方法不是一次性决定所有特征,而是通过循环地评估每个特征的变化对预测性能的影响,并根据反馈结果逐步优化输入特征子集。这样做的目的是找到最优特征组合,减少冗余和噪声特征对预测结果的干扰。
实验部分,论文采用了NASA数据集进行验证,通过对AUC(Area Under the Curve)等性能指标的计算,衡量了特征子集选择对于软件缺陷预测模型性能提升的效果。作者们的目标是通过这种特征选择方法,提高预测的精度和效率,从而为软件开发团队提供更有效的缺陷预防措施。
这篇论文的核心贡献在于提出了一种迭代式的特征选择策略,结合随机森林的优势,有效解决了软件缺陷预测中特征维度过高的问题。这种方法有望在实际软件开发环境中降低维护成本,提高软件质量。对于从事软件工程和机器学习领域的研究人员来说,这是一篇值得深入研究的重要文献。
2019-07-22 上传
2019-07-22 上传
2019-07-23 上传
weixin_39840387
- 粉丝: 790
- 资源: 3万+
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载