面向对象软件内聚度分布实证研究:新度量与适用性

0 下载量 20 浏览量 更新于2024-06-28 收藏 1.72MB PDF 举报
本文主要探讨了面向对象软件内聚度度量数据的分布特性,特别是在缺乏对LCOM(类内连接度)之外的内聚度度量的研究背景下。LCOM作为传统的内聚度度量,其有效性在实证研究中受到质疑。因此,研究者们决定通过实证方法对17个不同的内聚度度量指标进行深入分析,这些指标涵盖了内聚度缺乏度、基于连通性和基于相似性的度量。 研究对象是112个Java开源软件项目,对这些项目中的内聚度数据进行了详细的收集和分析。首先,研究人员尝试用幂律分布和对数正态分布来拟合度量数据,这两种分布在许多自然现象和复杂系统中具有广泛的应用。通过对每个度量指标的分布进行拟合,他们发现非规范化的内聚度量(如那些未经过标准化处理的)可以较好地用对数正态分布和幂律分布来描述。然而,对于规范化基于相似性的内聚度量,如CC(紧密紧密连接)、LSCC(弱紧密紧密连接)、SCOM(结构复杂性)和SCC(强紧密连接),需要排除那些方法数小于等于1或者字段数为0的特殊类,才能确保对数正态分布的适用性。同样,基于连通性的度量(如TCC、LCC、DCD和DCI)在进行这种分布拟合时,也需要使用其非规范化版本的数据。 这篇实证研究的结果对于理解和使用面向对象软件的内聚度度量具有重要的实践价值,它揭示了不同内聚度度量在实际项目中的数据分布模式,有助于开发人员和研究人员确定度量阈值,优化软件设计和维护。此外,研究还提供了关于如何选择合适的统计分布模型来描述内聚度数据的指导,这对于软件度量理论和工程实践的发展具有重要意义。这项工作填补了面向对象软件内聚度度量数据分布研究的空白,为进一步提高软件质量提供了数据支持和理论依据。