随机森林特征选择法提升软件缺陷预测

需积分: 9 42 浏览量更新于2024-09-06 收藏 775KB PDF 举报

本篇论文《软件缺陷预测中的特征选择方法：一种基于随机森林的策略》由李梦奇、秦素娟两位作者共同撰写，发表在 StateKeyLaboratoryofNetworkingandSwitchingTechnology 的北京邮电大学。论文旨在解决软件缺陷预测中常见的特征维度过大问题。传统的缺陷预测模型往往需要处理大量的特征，这可能导致模型复杂度增加，预测性能下降。作者们提出了一种新颖的特征子集选择方法，该方法以随机森林作为核心。他们对特征的重要性进行了量化评估，特别关注于第一个特征的选择，通过简化这个过程并改良了向前搜索策略。这种方法不是一次性决定所有特征，而是通过循环地评估每个特征的变化对预测性能的影响，并根据反馈结果逐步优化输入特征子集。这样做的目的是找到最优特征组合，减少冗余和噪声特征对预测结果的干扰。实验部分，论文采用了NASA数据集进行验证，通过对AUC（Area Under the Curve）等性能指标的计算，衡量了特征子集选择对于软件缺陷预测模型性能提升的效果。作者们的目标是通过这种特征选择方法，提高预测的精度和效率，从而为软件开发团队提供更有效的缺陷预防措施。这篇论文的核心贡献在于提出了一种迭代式的特征选择策略，结合随机森林的优势，有效解决了软件缺陷预测中特征维度过高的问题。这种方法有望在实际软件开发环境中降低维护成本，提高软件质量。对于从事软件工程和机器学习领域的研究人员来说，这是一篇值得深入研究的重要文献。

weixin_39840387

粉丝: 790
资源: 3万+

随机森林特征选择法提升软件缺陷预测

论文研究-基于ODC的软件缺陷度量研究.pdf

论文研究-一种基于WebService的EIP方案的研究.pdf

论文研究-基于超欧氏距离近邻传播的软件缺陷预测方法.pdf

论文研究-一种基于特权分级的quorum系统构造方案.pdf

最新资源