跨社交网络用户识别:基于标记行为的改进方法

2 下载量 127 浏览量 更新于2024-08-26 收藏 363KB PDF 举报
"通过标记行为跨社交网络的一种改进的用户识别方法" 在当今的社交媒体时代,用户经常在不同的社交网络上创建并维护多个虚拟身份。这导致了用户标识问题,即如何确定这些不同的身份背后实际上是同一个人。这篇研究论文探讨了跨社交网络(SNS)的用户识别方法,特别是关注用户标记行为的潜力。现有的解决方案大多依赖于用户配置文件属性的相似性、朋友生成的内容和链接,或者这些特征的组合。然而,该论文提出了一种新颖的方法,强调了标记行为在用户识别中的重要性。 作者们引入了一种改进的用户识别方法,基于标记行为,称为BM25的对称变体。BM25是一种常用的文本检索功能,它根据查询词在文档中的出现频率和逆文档频率对文档进行排名。在这个方法中, BM25被用来处理不同社交网络中用户标签的不一致性,考虑它们之间的语义关系,以理解查询词在文档中的相互关联。这种方法能够捕捉到标签的特性和多样性,从而提高用户匹配的准确性。 论文中,作者们利用从不一致的标记行为、配置文件属性以及支持向量机(SVM)的监督学习技术中提取的特征,构建了一个分类器。该分类器旨在执行两个社交网站之间的用户身份匹配。通过对真实世界数据集,如豆瓣和微博的数据进行评估,结果显示,与仅基于普通标签的方法相比,这种方法的准确率提高了30%。 这一发现强调了在解决跨SNS用户识别问题时,不仅需要考虑传统的特征,还需要深入挖掘用户的交互行为,尤其是标记行为。这种改进的方法为今后的跨社交网络身份验证研究提供了新的视角,可能对社交媒体分析、用户行为建模和隐私保护等领域产生积极影响。通过更准确地识别用户在不同平台上的身份,可以增强个性化推荐、社交媒体营销策略,以及打击网络欺诈等应用。