深度学习框架CNN-LDA:提升代码质量分析的精度

0 下载量 5 浏览量 更新于2024-06-17 收藏 2.36MB PDF 举报
深度学习框架CNN-LDA在代码质量分析中的应用是一项重要的研究成果,它结合了潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)和卷积神经网络(Convolutional Neural Network, CNN)技术,旨在提高软件开发过程中的代码质量评估效率。本文由沙特国王大学的沙伊马·索罗尔等作者合作完成,他们分别来自埃及和澳大利亚的多所高等教育机构,专注于特殊教育和信息技术领域的研究。 在当前的软件开发环境中,代码质量(CQ)被视为关键因素,因为它影响着软件的可读性、安全性和可测试性,进而影响整体软件质量(Software Quality, SQ)。传统的方法往往依赖于源代码分析,但可能存在局限性,导致精度不高,因为输入和输出之间的关联性不强。因此,CNN-LDA框架的提出是为了克服这些挑战,通过深度学习技术实现对CQ的自动化和精确评估。 CNN-LDA框架的核心是利用CNN进行特征提取,从编程数据中识别与可读性、安全性和可测试性相关的主题。它将代码文本转化为可供机器学习算法处理的输入,然后通过LDA模型进行主题建模,以便更好地理解代码结构。研究者们采用随机森林(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)等机器学习方法进行了模型验证,结果表明CNN-LDA在多个数据集上的表现优于同类方法。 具体来说,CNN-LDA在可读性、安全性以及可测试性这三个关键指标上的平均总体F-度量分别达到了94%、94%和93%,平均总体准确率也相当高,分别为93%、93%和92%。这些结果通过Wilcoxon非参数统计检验得到了显著性支持,证明了CNN-LDA在提升代码质量分析的准确性和效率方面具有显著优势。 本文还强调了开放获取的特性,基于Creative Commons Attribution-NonCommercial-NoDerivatives (CC BY-NC-ND) 许可证,这意味着读者可以免费访问并用于非商业目的,但不能修改或再分发。沙特国王大学作为出版方,通过爱思唯尔公司发布这篇文章,促进了知识的共享和学术交流。 CNN-LDA作为一种创新的深度学习框架,对于改进代码质量分析、提高软件开发效率以及确保安全关键系统的开发具有重要的实践价值。随着人工智能和机器学习技术的发展,这种方法有望在未来的软件工程领域得到广泛应用。