微博用户相似度新法:结合兴趣与背景信息的BIBS研究

需积分: 32 2 下载量 176 浏览量 更新于2024-08-13 收藏 1.82MB PDF 举报
本文主要探讨了融合兴趣的微博用户相似度计算的研究问题。在当前的微博用户相似度计算方法中,传统的基于用户博文内容和共同好友数量的方法可能存在潜在误差较大的问题,而基于多源背景信息的模型虽然考虑了用户的多元化数据,但计算复杂度较高,并且容易忽视用户的兴趣这一关键因素。针对这些问题,研究者提出了一个综合相似度计算方法——BIBS(结合兴趣和背景信息的相似度)。 BIBS方法的核心在于两个部分:一是用户兴趣的挖掘和相似度计算。首先,通过用户的个人标签直接提取用户的兴趣,如果标签信息不足,则通过用户关注关系网络的重要用户聚类来推断用户的潜在兴趣,以此构建兴趣相似度矩阵。这种方式不仅考虑了用户的兴趣,还减少了数据的直接依赖,增加了模型的鲁棒性。 二是背景信息的利用。论文中提到的背景信息包括用户的性别、年龄和地点等,这些属性对于理解用户的社交行为和偏好至关重要。研究者将这些属性整合进相似度计算,采用层次化的挖掘策略,逐层筛选出最符合用户特征的其他用户,进一步提高相似度计算的精确度。 为了验证BIBS方法的有效性和准确性,研究者在新浪微博的大规模数据集上进行了实验。实验结果显示,相比于基于多源信息相似度的微博用户推荐算法MISUR,BIBS在减少计算时间的同时,准确率、召回率和F值都有显著提升。具体来说,BIBS在用时减少8.1%的情况下,准确率提高了16.7%,召回率提升了13.6%,这充分证明了BIBS在实际应用中的优势。 这篇研究不仅填补了微博用户相似度计算中对兴趣因素重视不足的空白,而且提供了一种更为高效和精准的用户相似度计算策略,对于个性化推荐、社交网络分析等领域具有重要的理论和实践价值。同时,其研究方法和实验结果也为后续的社交媒体用户行为分析提供了新的思路和参考。