微博虚假信息检测:基于把关人行为的早期识别方法

0 下载量 46 浏览量 更新于2024-07-15 收藏 934KB PDF 举报
本文档深入探讨了一种基于把关人行为的微博虚假信息及早检测方法,发表于《计算机学报》第38卷第132期,由中国计算机学会出版。在当前社交媒体盛行的时代,微博作为信息传播的重要平台,却面临着虚假信息泛滥的问题。传统的检测方法主要依赖于分类算法,这在应对快速扩散的虚假信息时显得力不从心,无法实现及时预警。 文章的创新之处在于构建了一个基于隐半马尔可夫模型(HMM)的研究框架。该模型假设信息转发者和评论者的对流行真实信息的把关行为可以被描述为状态持续时间的概率服从Gamma分布。这种方法能够捕捉到用户对信息的接收、传播和判断过程,从而更有效地识别出虚假信息的早期迹象。 检测流程分为两步:首先进行模型训练,通过历史数据学习把关人行为的规律;其次,在实际应用中,对于每一条微博信息,通过计算其传播过程中产生的观测序列与模型的平均对数似然概率,实时更新信息的可信度评分。这个评分系统能帮助快速识别那些可信度较低、可能存在虚假信息的帖子,以便尽早介入并阻止其进一步传播。 为了验证这一方法的有效性,作者使用了来自新浪微博和Twitter的数据集进行实验。实验结果显示出,基于把关人行为的检测策略能够显著提高虚假信息的早期识别率,有助于降低虚假信息对公众认知和社会秩序的负面影响。 这篇研究论文关注的是如何利用社交网络中的把关人机制,结合统计建模技术,来提升微博虚假信息的检测效率和准确性,这对于维护社交媒体生态的健康运行具有重要的实践意义。