工具和技术(Soares和Fagundes,2017)。对移动应用程序进行测试
的估计有助于降低测试所涉及的风险,使测试变得简单和准确。在估计
移动 应用 程序 的测 试工 作量 的背 景下 ,很 少进 行调查 (Aranha和
Borba,2009年; Wadhwani等人,2008年)。在传统软件的许多研究
中 已 经 提 出 了 基 于 大 小 的 测 试 工 作 量 估 计 ( Abran 等 人 ,
2007;Arumugam 和 Babu , 2015; de Almeida 等 人 ,
2009;Nageswaran , 2001; Silva 等 人 , 2009 年 ) 。 功 能 规 模 度 量
(FSM)关注的是度量从需求获得的软件功能。有限状态机提供了不受
编程语言和软件开发技术限制的度量.功能规模是量化软件开发所需工作
量的主要输入。软件的功能大小已被证明会影响软件项目的工作量和成
本(Huijgens等人,2016年)。软件规模度量可用于评估和预测。预测
测量或估计使用数学模型和预测程序(Gencel,2005)。如表1所示,
国际标准化组织(ISO)在ISO/IEC 14,143中定义了许多功能尺寸测
量方法。
功能大小测量(FSM)的第一次尝试是执行-
Allan Albrecht在1979年(Albrecht和Gaffney,1983)引入功能点分
析(FPA)。FPA以功能需求为基础,然后被认为是预测软件开发规模
和工作量的技术因素。FPA已经发展了许多代,目前正在被ISO标准认
可。Mark II FPA是Symons于1988年建立的,它对基本FPA进行了改
革。它测量逻辑事务的安排并计算软件的功能大小.商业信息系统是设计
Mark II FP的主要目标。2002年被ISO标准认可(ISO/IEC 20968:
2002,2002)。NESMA(荷兰软件度量用户协会)功能尺寸测量方法
于1989年开 发,并 于2005年被认可为 ISO标准(ISO/IEC 24570:
2005,2005),Albrecht这两种方法都有相同的规则,通过计算外部
输入(EI),外部输出(EO),外部接口(EQ),外部接口或文件
(EIF)和内部逻辑文件(ILF)的基本组件和复杂性来确定函数大小
(Abran,2010)。NESMA引入了一个影响因素,允许以相同的方式
使用相同的比率估计新的开发和增强。除此之外,差异在于外部查询与
外部输出、外部查询的复杂性&、隐含查询、代码数据(代码表)、物
理介质、具有多个选择的查询(Koh等人,2008年)。FiSMA(芬兰软
件测量协会)方法也是基于要求,并在2010年的ISO/IEC 29881标准
(ISO/IEC 29881:2010,2010)中得到 认可。FiSMA是面向服务
的,而不是一个过程。在fiSMA方法中,功能用户需求被认为是基本功
能组件(BFC)。BFC有七个类别,这些类别进一步分为基本函数类型
(Forselius,2004)。函数的COSMIC(通用软件测量国际联盟)方
法
表
1
ISO
标准认可的
FSM
方法(
ISO/IEC 14143-6
:
2012
,
2012
)。
FSM
方法
ISO标准
MK II功能点分析(ISO/IEC 20968:2002,2002)NESMA功能尺寸测量方法
( ISO/IEC 24570 : 2005 , 2005 ) IFPUG 功 能 尺 寸 测 量 方 法 ( ISO/IEC
20926 : 2009 , 2009 ) FISMA 功 能 点 ( ISO/IEC 29881 : 2010 , 2010 )
COSMIC功能尺寸测量方法(ISO/IEC 19761:2011,2011)
尺寸测量在2011年由ISO标准化(ISO/IEC19761:2011,2011)。所
有其他FSM方法都被认为是第一代FSM,而COSMIC能够处理更广泛
的应用领域被认为是第二代FSM。
在本文中,我们选择COSMIC FSM进行尺寸测量,因为它适用于更
广泛的应用领域(Abran等人,2015年)。IFPUG FPA和其他FSM的
主要批评是由于它们在不同软件领域(如嵌入式软件,实时应用程序,
移动应用程序等)的适用性不一致。第二代FSM,即COSMIC方法可
以克服这一不足。选择COS-MIC FSM进行本研究的另一个原因是它关
注功能需求的“用户视图”,并应用于软件开发的整个生命周期,从软件
需求规范(SRS)到维护阶段(Kassab等人, 2009年)。
根据(Kamala Ramasubramani,2016),COSMIC FSM也可以
用于估计测试工作量。此外,计算软件的COSMIC功能规模的过程包括
识别“功能过程”。软件的这些功能过程构成了规划测试用例的良好基础
(COSMIC组织,2018)。基于COSMIC规模的估算模型可用于估算
软件开发的整个生命周期或任何主要生命周期活动(如测试过程)的工
作量(Jayakumar和Abran,2013)。选择COSMIC进行测试工作量
估计的主要优点和原因是COSMIC的目标是:-在应用程序生命周期中的
任 何 时 间 和 应 用 程 序 的 任 何 分 解 级 别 上 , 测 量 都 应 该 是 可 能 的
(Symons等人, 2016年)。
考虑到(Kamala Ramasubramani,2016; Symons等人,2016)
促使我们评估COSMIC是否可以有效地进行移动应用程序的测试评估。
为此,可以研究伴随的研究问题:
RQ 1. COSMIC规模测量与移动应用程序的测试工作量测量是否
RQ 2. COSMIC功能大小度量是移动应用程序测试工作量估计的良
好预测器吗?
RQ 3.通过考虑移动应用程序的特定特征(NFR)和测试特征以及
COSMIC大小,是否可以提高测试工作量估计的准确性?
为了回答RQ 1和RQ 2,使用通过收集不同行业和自由职业者的移动
应用数据创建的数据集进行实证研究。为了回答RQ 1,使用非参数关联
统 计 Spearman rho 检 验 ( Conover , 1999 ) 验 证 测 试 工 作 量 和
COSMIC测量之间的相关性对于RQ2,使用线性回归技术建立了一个测
试工作量估计模型,用于预测作为结果变量的测试工作量和作为预测变
量的COSMIC大小。 该模型的验证,验证和评估其准确性,使用不同
的措施。
对RQ 1和RQ 2的肯定回答促使作者考虑其他可能会或可能不会影响
移动应用程序测试工作的因素。除了预测测试工作量的功能大小外,还
研究了(Kaur和Kaur,2018)确定的可能影响测试过程的移动应用程
序 的 其 他 明 显 特 征 。 根 据 COSMIC/IFPUG 术 语 表 ( COSMIC 和
IFPUG,2015; Symons,2015)中的NFR子集,将这些不同的移动应
用程序特征映射到非此外,测试特性(Abhilasha和Sharma,2013;de
Almeida等 人 , 2009; Nageswaran , 2001; Srivastava 等 人 , 2014
年,2012年)适用于所有类型的项目被认为是在这项研究中。为此目
的,RQ3被形成。为了回答RQ3,根据SRS文档评估每个移动应用程序
特征的影响,并将其作为组合预测变量,即MobileFactor。同样,测试
特征的影响,即测试过程的工件,作为组合变量在TestFactor下进行评
估和涵盖。预测测试工作量的回归模型