基于结构化信息的二进制文件同源性精确检测方法

0 下载量 10 浏览量 更新于2024-08-13 收藏 1.19MB PDF 举报
本文主要探讨了二进制文件同源性检测的结构化相似度计算方法,发表于2012年的《北京邮电大学学报》。作者刘春红、郭涛、崔宝江和王建新在研究中针对软件克隆问题,提出了一个创新的解决方案。他们强调了利用二进制文件的结构化信息来提高检测精度,具体做法是设计了一种基本块签名,这是一种基于文件、函数和基本块层次结构的分析技术。 该方法首先构建了一个基于基本块属性和结构化信息的基本块相似度度量,通过对每个基本块的特征进行比较,如代码逻辑、指令序列等,来评估两个基本块之间的相似性。接着,他们进一步利用函数的结构化信息来赋予函数不同的权重,这样在计算整个文件的相似度时,会考虑不同功能模块的重要性,从而得出更为精确的文件同源性评估。 论文通过对比实验,将提出的加权相似度算法与不加权算法以及主流的二进制比对工具进行比较,结果显示,加权方法能够更准确地反映出两个二进制文件的相似程度,对于识别和追踪软件克隆行为具有更高的敏感性和准确性。 关键词包括:二进制文件、同源性检测、结构化签名和权重。研究方法和结果对于软件工程、恶意软件分析、知识产权保护等领域具有重要意义,展示了如何利用高级分析技术提升在非文本型数据中的相似性度量效果。 这篇论文提供了一种有效且结构化的二进制文件同源性检测方法,对于理解和改进软件版权保护、反抄袭和安全审计等领域具有实用价值。通过深入理解并应用这些技术,研究人员和开发者可以更好地应对软件复制和变异的问题。