自动化检测维基百科傀儡账户:机器学习与神经网络方法

0 下载量 83 浏览量 更新于2024-06-21 收藏 972KB PDF 举报
本文主要探讨了自动检测维基百科中傀儡账户的问题,这是一项针对计算机科学硕士论文的研究。傀儡账户是指被用于欺骗目的的在线身份,通常由同一个实体控制多个账户,以规避限制或进行恶意编辑。由于维基百科的开放编辑模式,它容易受到这种滥用的影响。当前,傀儡账户的检测主要依赖于管理员的人工验证,这既耗时又低效。研究的目标是构建一个基于机器学习和神经网络的自动化系统,能够早期识别傀儡账户的模式并建议暂停其活动。 研究将问题设定为二元分类任务,设计了一组新的特征来捕捉用户的异常行为,这些特征既考虑了用户账户活动,也分析了他们的贡献内容。解决方案的核心在于开发一种策略,能自动检测和分类来自同一作者的多个账户的可疑编辑。这个系统有望提高傀儡账户检测的效率和准确性,保护维基百科免受恶意编辑的侵害。 作者Mostofa Najmus Sakib在2022年8月完成了他的硕士学位论文,该论文在Boise State University的计算机科学学院提交。论文经过了由Francesca Spezzano博士、Edoardo Serra博士和Nasir Eisty博士组成的指导委员会的最终口试,并得到了一致通过。 这篇论文的贡献不仅在于提出了一个技术解决方案,还可能对维基百科的社区管理和互联网安全领域产生深远影响。通过自动化检测,可以更有效地对抗故意破坏、垃圾邮件和未公开的付费编辑等行为,维护维基百科的公正性和可信度。此外,该研究的方法论也可能适用于其他开放编辑平台或社交网络,对于识别和打击网络欺诈行为具有普遍价值。