x-star网络模式下异构信息网络的top-k相似性搜索

0 下载量 51 浏览量 更新于2024-08-26 收藏 1.07MB PDF 举报
"在异构信息网络中,x-star网络模式被广泛应用于数据组织和分析。随着这类网络的普及,从x-star网络中提取知识变得至关重要。x-star网络由中心节点和连接到这些中心的不同类型属性构成,这使得网络具有丰富的信息层次。在这样的网络中进行top-k相似性搜索是寻找与特定查询中心高度相似的其他中心的过程,这对于推荐系统(如协同过滤)、社区发现和网络搜索引擎等应用有着重要的价值。 尽管已有的一些方法,如SimRank和P-Rank,能够提供有前景的相似度结果,但它们在处理大规模x-star网络时面临着效率问题。因此,本文提出了一种名为NetSim的新方法,它专注于结构相似性的度量。NetSim首先在预处理阶段计算属性之间的相似性,利用属性网络上的预期会合概率。然后,在查询处理阶段,依据属性相似度动态计算中心之间的相似度,这种方法直观地考虑了中心与相似属性链接的关系。 与仅关注属性的方法相比,NetSim在时间和空间复杂度上都有显著优势,因为它只需要处理相对较小的属性网络,而不是整个x-star网络。为了加速在线查询处理,作者开发了一种修剪算法,并构建了修剪索引,能有效地剔除那些不可能成为候选结果的中心,进一步提升了搜索效率。 大量的实验验证了NetSim方法的有效性和高效性,通过与现有的最新技术对比,证明了其在大规模x-star网络中的优越性能。这些发现对于理解和优化在异构信息网络中的相似性搜索策略具有深远的影响,为未来的相关研究提供了有价值的参考和指导。" 关键词: 相似性搜索、信息网络、x-star网络模式