DELT：基于Bootstrap的多样性生成增强学习软件缺陷预测

192 浏览量更新于2024-06-17 收藏 1.59MB PDF 举报

"基于Bootstrap聚合的软件缺陷预测的多样性生成增强学习技术" 本文主要探讨了如何利用Bootstrap聚合（Bagging）方法结合多样性生成增强学习技术来提高软件缺陷预测的准确性。软件缺陷预测是软件工程领域的一个关键任务，它有助于在开发过程中尽早发现并修复潜在的问题，从而减少时间和成本。由于软件缺陷的复杂性和难以识别性，研究人员一直在寻求更有效的预测模型。 DELT（Diversity-Enhanced Learning Technique based on Bagging）是文中提出的一种新方法，它融合了多种机器学习模型，以实现更好的泛化性能。DELT的核心在于利用Bootstrap采样创建多个训练集，然后训练不同的基础学习器，这些学习器在多样性上有所差异。通过这种方式，DELT能够捕获数据的多个方面，避免过拟合，并且通过集成学习策略（如多数投票）对未标记的测试模块进行缺陷预测。在相关工作部分，作者讨论了现有的工作，包括项目内缺陷预测（Project-Internal Defect Prediction, PIDP）和多样性集成学习系统。PIDP关注于预测同一项目中的模块缺陷，而多样性的集成学习则通过结合多个学习器的预测来提高整体性能。论文进一步详细介绍了软件缺陷的定义及其正式表示，以及如何构建问题公式来处理项目内缺陷预测数据。作者定义了项目中的缺陷数据，明确了预测数据的类型，并详细解释了问题陈述的过程。在DELT的介绍中，作者阐述了Bagging的背景和工作原理，这是一种通过随机抽样创建子集来训练多个独立模型的技术，这些模型的组合可以提升整体的预测准确度。DELT通过引入多样性生成，增强了各个学习器之间的差异性，使得集成后的模型能够更好地应对未知数据。实验部分，DELT在43个公开的PROMISE和NASA数据集上进行了广泛验证，结果表明这种方法在软件模块的缺陷倾向预测上表现出了较高的泛化性能，证实了其潜在价值和贡献。这篇论文提出了DELT，一种基于Bootstrap聚合的多样性增强学习技术，旨在提升软件缺陷预测的准确性。通过结合多种学习器和利用Bootstrap采样，DELT能够在不同数据集上展示出优秀的预测性能，对于软件开发过程的质量控制具有重要的实践意义。

Umamaheswara Sharma Bhutamapuram
和
R.
萨达姆
沙特国王大学学报
8678
对多种集成学习系统的相关工作进行了总结，为其它应用提供参考。
2.1.
WPDP
的学习环境
在过去的几年里，为
WPDP
构建集成学习模型正在取得进展 在
（
Laradji
等人，
2015
），
Laradji et al.
目标是通过使用特征选择
和集成学习方法的组合来显示对缺陷预测性能的积极影响在三个数据
集
PC2
，
PC4
和
MC1
上进行实验，所提出的平均概率集成（
APE
）
与 前向特征 选 择 方 法 相结合 时 ， 成 功 地解决了类 不 平 衡 问 题。
Misirli
等人（
2011
）使用投票特征区间方法来降低误报率并提高缺
陷预测的精度。这项研究是在
WPDP
的背景下对项目
CM1
、
PC1
、
PC3
、
PC4
、
AR3
、
AR4
和
AR5
使用促进方法进行的。 在（
Peng
等
人，
2011
），
Y. Peng
等人提出了一种评价集成方法质量的层次分
析法（
AHP
）
AHP
是一种多准则决策方法，它基于两两比较提供良
好的决策方案。这项研究是使用各种集成学习技术进行的，单个分类
器建立在
10
个
NASA
的
MDP
数据集上。研究结果表明，
AdaBoost
集
成方法在其他集成学习器中效果最好
.
Petric 'et al.（2016）提出了一种用于SDP的堆叠集成学习方法。为
了探索不同分类器之间的差异，对从四个不同家族中选择的分类器进行
加权精度多样性（WAD），并得出为了解决类别不平衡的问题以及在
使 用 传 统 特 征 学 习 预 测 模 型 时 预 测 性 能 较 低 的 问 题 ， Tong 等 人
（2018）提出了一种称为两阶段集成学习（TSE）的方法，该方法采用
了两个概念，如堆叠去噪自动编码器（SDAE）和集成学习。SDAE用
于从度量中提取深度表示，并且集成方法用于分类。通过对12个NASA
项目的实验，作者得出结论，TSE有效地解决了类不平衡问题。
Wang
等人（
2011
）对
WPDP的七种不同集成学习技术他们的研究
得出结论，验证和投票方法优于所有其他集成技术。 最近，
Di Nucci
等人提出了一种自适应选择分类器的错误预测（
ASCI
）。（
2017
）
在 其 他 分 类 器 中 动 态 地 选 择 最 佳 分 类 器 。 他 们 的 研 究 在
30
个
PROMISE
项 目 上 使 用 了
5
个 诱 导 器 的 堆 叠 集 成
，如 朴 素 贝 叶 斯
（ NB） ， 逻 辑 回归 （ LR ） ， 径 向 基 函 数 （ RBF ） ， 多 层 感 知 器
（MLP）和决策树（DT）
。
2.1.1.
文献中的意见
作品（Laradji等人，2015; Misirli等人，2011; Peng等人，2011;
Petric等人 ，2016; Tong等人，2018; Wang等 人，2011; DiNucci等
人，2017年1月21日，在第2017年1月21日，在第2017年1月21日，
充分利用集成学习的WPDP。也就是说，例如，作品（Laradji等人，
2015; Tong等人，2018）表明，集成模型可以内在地缓解类不平衡问
题。此外，作品（Misirli等人， 2011; Peng等人，2011; Petric等人，
2016; Wang等人， 2011; Di Nucci等人，2017）得出结论，集成模型
可以成功地缓解低预测性能。 然而，根据（Opitz and Maclin，1999;
Rokach，2010; Zhou，2012），观察到集成模型中的多样性生成机制
可以显著消除学习模型的不稳定性。在这方面，装袋方法有效地工作
时，
与其他传统的集合模型相比（
Breiman
，
1996
）。根据
Breiman
（
1996
）的说法，
装袋
方法有能力胜过所有其他单独的模型。使用
bagging
方法的另一个优点是成功地消除了小尺寸和不平衡数据集的
类不平衡问题（
Galar
等人，
2011; Tong
等人，
2018
年）。针对软件
项目缺乏足够数据的情况，通过考虑多样性生成机制和装袋集成来解
决
WPDP
问题。
2.2.
文献中的多样集成学习系统
在文献中，很少探讨用于分类任务的多样集成学习系统的方法很
少有可用的出版物将多样性生成的概念用于其他领域中的任务，例如
入侵检测（
Mukkamala
等人，
2005; Gupta
和
Rani
，
2020
），以及
检 测 恶 意 软 件 代 码 （
Zhang
等 人 ，
2007; Menahem
等 人 ，
2009
年）。上述工作利用了不同的集成分类器，并且它们的分析仅限于多
诱导系统。据我们所知，这是第一个工作，讨论的概念，多样性生成
通过自助抽样和多诱导系统的背景下，在项目内的缺陷预测。
3.
问题公式化
在本节中，通过定义诸如
例程、软件模块
和
软件程序
等术语，给出
了
软件缺陷
的正式符号。之后，缺陷数据被表示为训练和测试模型。最
后，形式化地定义了WPDP的学习问题。
3.1.
软件缺陷
本节提供了软件缺陷的解释。很多时候，术语软件缺陷与文献中的
术语
故障
互换使用（Lyu，1996）。 最初，软件缺陷的分类是从软件
开发过程中创建的，以便更好地理解。随后，提出了术语
缺陷
和
失效
之
间的关系。
在任何软件开发过程中，在每个阶段，工件（如图表，设置脚本
或模块等）都被开发并存储在数据库中。一个过程通常有几个检查
以确保产品P是否正在开发 去见记录下来的文物每次检查都会识别与实
际工件的偏差，这保证了过程的变更
一
产品中工艺所需的变更被称为缺陷（
Lyu，1996
）
。因此，在软件开发
生命周期（SDLC）的所有级别进行检查都可能产生缺陷（Hailpern和
Santhanam，2002）。有不同的编程方法可供程序员开发软件项目。
结构化程序设计、面向对象程序设计（OOP）、模块化程序设计等，通
过将任务分解为独立的、可互换的部分/模块来构建大型程序。为了理解
这一点，常规这个词
， 模块
和
软件
程序
定义如下。
定义
1
（
常规（
r
）
）。它是执行特定任务的不可破坏和可重用的过
程
/
函数。
定义
2
（
模块（
m
）
）。它是包含一个或多个例程的程序的一部分。
也就是说，任何模块
m
都是由
来自集合
fr
1
;
. .
;
r
r
;
r
2
Z
;
g
.