高校智能垃圾邮件误判召回系统研究

0 下载量 137 浏览量 更新于2024-08-29 收藏 2.31MB PDF 举报
本文主要探讨了高校误判垃圾邮件自动召回系统的研发与实践。在清华大学的邮箱系统和反垃圾邮件网关系统上进行了为期一年的实地部署和实验,时间跨度从2011年9月至2012年10月。研究关注的核心问题是垃圾邮件的误判问题,这是反垃圾邮件技术领域的一大挑战。 传统的反垃圾邮件过滤方法往往难以避免误判,因为它们依赖于固定的规则或特征来识别垃圾邮件,但这样可能导致部分重要邮件被误判为垃圾邮件。为了克服这一问题,研究团队采用了一种创新的策略。他们利用用户的反馈行为,特别是用户对可疑邮件的点击召回记录,来分析用户的兴趣模式。通过对用户感兴趣垃圾邮件的文本相似度计算,系统能够理解用户可能对特定类型或主题的邮件有特殊喜好。 此外,研究还结合了多种技术,如隐性索引模型、向量空间模型、神经网络集成、KNN(K-近邻算法)和贝叶斯分类器等高级算法。这些技术的融合有助于提高预测精度,使得系统能够更智能地预测用户对当前邮件的兴趣程度,从而减少误判。这种基于用户主观选择和体验的召回机制,旨在提高用户体验,让用户能够自主召回那些被误判但其实有价值的邮件。 论文的关键贡献在于提出了一种用户参与式的解决方案,通过个性化推荐和智能预测,改善了反垃圾邮件系统的误判问题。这种方法不仅提升了系统的准确性和实用性,也为未来的研究提供了新的思路,即如何更好地理解和满足用户的个性化需求,以提高电子邮件服务的整体质量。整个研究结果发表在2013年9月的《通信学报》上,具有较高的学术价值和技术应用前景。