关联分析与N-Gram错误参数检测法:提升软件缺陷识别效率

0 下载量 39 浏览量 更新于2024-06-28 收藏 1.51MB PDF 举报
本文主要探讨了一种新颖的错误参数检测方法,名为ANiaD(基于关联分析与N-Gram的错误参数检测),它旨在提高软件系统中错误参数的检测效率。该方法由北京理工大学计算机学院的李超和刘辉提出,并发表在《软件学报》上,2018年第29卷第8期,DOI:10.13328/j.cnki.jos.005531。 ANiaD的核心思想是结合关联分析和N-Gram语言模型来识别潜在的错误参数。首先,通过大量的开源代码数据,构建了一个关联分析模型,用于发现函数调用中参数之间的强烈关联规则。这些规则揭示了参数之间的共现模式,有助于识别可能不合理的参数组合。 接下来,ANiaD针对具有强关联规则的函数调用构建N-Gram语言模型。N-Gram是一种统计语言模型,它根据连续的n个符号序列出现的概率来预测文本。在这个上下文中,它用来估计给定函数调用的正确概率。如果某个函数调用的概率低于预设阈值,那么它就被标记为异常函数调用,因为这可能是参数错误的迹象。 在实验验证阶段,研究者选择了10个开源Java项目作为测试平台。结果显示,ANiaD的查准率达到了约43.40%,相较于现有基于相似度的检测方法(查准率25%),表现出显著的优势。这意味着ANiaD在准确识别出含有错误参数的函数调用方面具有较高的性能。 ANiaD方法提供了一种有效且统计学驱动的错误参数检测策略,利用关联分析挖掘参数间的模式,并结合N-Gram模型评估函数调用的合理性。这对于软件质量保证和故障诊断具有重要的实际应用价值。对于软件开发人员来说,这种自动化的检测工具可以辅助他们更早地发现并修复潜在的错误,从而提高软件系统的稳定性和可靠性。