匈牙利匹配算法提升钓鱼网页检测效果

0 下载量 144 浏览量 更新于2024-09-01 收藏 626KB PDF 举报
钓鱼网页检测是网络安全领域的重要课题,本文主要探讨了一种基于匈牙利匹配算法的创新方法。当前,有效衡量和识别钓鱼网页的相似性是关键挑战,因为现有的检测手段在准确性和效率上仍有待提升。作者提出的模型针对这个问题,首先对网页进行深入分析,提取了三个主要特征:渲染后的文本特征签名、图像特征签名以及网页的整体特征签名。这些特征全面反映了网页访问后的状态,有助于捕捉到可能存在的欺骗性元素。 匈牙利匹配算法在这个模型中发挥了核心作用。它被用来构建一个二分图,其中节点代表网页特征,边表示特征间的关联度。通过寻找最佳匹配,即找到最匹配的特征对,算法能够客观地评估不同网页之间的相似性。这种方法避免了简单的一对一或一对多匹配方式可能导致的误判,从而提高了钓鱼网页检测的精确度。 实验部分通过一系列仿真实验验证了这种模型的有效性和性能。结果显示,基于匈牙利匹配的钓鱼网页检测方法在准确率和召回率方面表现出色,这表明其在实际应用中具有很高的有效性。参与研究的专家包括张卫丰博士(主要研究Web信息获取、Web数据挖掘和Spam检测)、周毓明教授(软件度量和软件测试)、许蕾副教授(Web测试和WebService测试)、徐宝文教授(软件测试和Web技术),他们的联合工作展示了该领域的前沿进展。 总结来说,本文介绍了一种创新的钓鱼网页检测技术,通过结合网页特征提取和匈牙利匹配算法,提升了网页相似性度量的精度,对于提升网络安全防护能力具有重要意义。这种方法不仅提供了更有效的钓鱼网站识别手段,也为未来相关研究提供了新的思路和技术支撑。