多重增强图与主题分析在社交短文本检索中的应用

1 下载量 177 浏览量 更新于2024-08-26 收藏 564KB PDF 举报
"这篇研究论文探讨了一种基于多重增强图和主题分析的社交短文本检索方法,旨在解决社交网络平台上短文本检索的挑战。作者来自江西财经大学信息管理学院、数据与知识工程江西省高校重点实验室以及江西科技师范大学。" 本文针对社交网络上的短文本特性,如内容简短、存在转发评论关系、话题多样、与网页链接以及作者间的关注关系等,提出了一个新的检索方法——基于多重增强图的社交短文本检索方法(SSTR)。该方法利用多重增强图算法对初步检索结果进行再排序优化和去重,旨在提高检索效率和准确性。 多重增强图算法基于马尔科夫链理论,通过构建不同的图层来模拟文本、作者和词语之间的多层面关系。每个层面的关系通过图中节点间的边来表示,并通过迭代运算达到各层面关系的稳定状态,从而强化这些关系。在构建多重增强图时,短文本的相似度计算借鉴了主题分析的结果,这有助于克服传统TF-IDF权重在处理短文本时的局限性。 在实验部分,SSTR方法与Indri、reRank-COS和reRank-LDA等其他方法进行了比较。结果显示,SSTR在排序效果上表现出优越性,尤其适用于初始检索结果较多的情况。该文关键词包括社交短文本检索、多重增强图和LDA主题模型,表明研究主要集中在社交网络文本处理和信息检索技术领域。 通过这种方法,研究者们旨在提升社交网络检索的精确性和效率,为用户在海量的社交信息中快速找到相关和有价值的内容提供技术支持。该论文的贡献在于创新性地将多重增强图和主题分析相结合,为社交短文本检索提供了新的解决方案,对于理解和处理社交网络上的信息具有重要意义。