基于二叉树搜索的多密集块检测方法在张量数据分析中的应用

需积分: 9 1 下载量 146 浏览量 更新于2024-09-07 收藏 912KB PDF 举报
"这篇论文介绍了一种新的多密集块检测方法,称为DDB-BST,用于在张量数据中寻找异常或欺诈行为。该方法利用二叉树搜索策略,改进了传统方法在检测准确率和召回率上的不足。" 在张量数据分析中,密集块通常与异常或欺诈行为有关,如社交媒体的僵尸粉活动或网络攻击。传统的密集块检测方法虽然能识别这些行为,但其性能受到限制,表现为低准确率和低召回率。为了解决这些问题,论文提出了一种名为DDB-BST(基于二叉树搜索的多密集块检测)的新方法。该方法的核心是通过局部搜索策略,依据特定的评价指标对张量数据进行分割,形成一个二叉树结构。 DDB-BST算法首先在张量数据中寻找评价指标值最高的子张量,然后将这个子张量分为左右两个子节点。接着,算法会持续比较父节点与左右子节点的评价指标值,根据它们之间的数值关系决定二叉树的生长是否应该停止。论文中提供了严格的数学证明来确立终止条件,确保了算法的效率和准确性。 实验结果显示,DDB-BST在合成数据集和真实数据集上与现有的M-zoom多密集块方法相比,F1值提升了约30%,这表明新方法在检测效果上有显著的提升。F1值是衡量检测方法综合性能的关键指标,它结合了精确度和召回率,从而全面评估了算法的性能。 此外,该研究得到了国家自然科学基金和江苏省自然科学基金的支持,作者范卫俊和程艳云分别从事网络用户异常行为和网络优化、行为分析的研究。他们的工作为张量数据中的异常检测提供了新的视角和有效工具,有助于进一步提升对网络异常行为的识别能力,对于网络安全和数据分析领域具有重要意义。