PMI-Bayes算法在网络食品安全情感分析中的应用

0 下载量 105 浏览量 更新于2024-08-28 收藏 413KB PDF 举报
"本文介绍了基于网络食品安全的PMI-Bayes倾向性分析方法,该方法结合PMI-IR、TF-IDF和朴素贝叶斯算法,用于情感倾向性分类,尤其适用于网络食品安全信息的监控和分析。实验表明,该算法在正负情感分类中的准确率较传统方法有所提高,并可扩展应用到其他网络评论的情感分析中。" 网络食品安全是现代社会关注的重要议题,而情感倾向性分析则是有效监测和理解公众舆论的关键技术。本文的作者刘金硕等人提出了一种名为PMI-Bayes的情感倾向性分类方法,该方法旨在快速分析网络上的食品安全信息,以便及时发现潜在的问题并指导食品安全管理。 PMI-Bayes算法结合了三个关键技术:PMI-IR(Pointwise Mutual Information - Information Retrieval)、TF-IDF(Term Frequency-Inverse Document Frequency)和朴素贝叶斯分类。PMI-IR算法用于量化词汇之间的关联性,识别出具有特定情感色彩的词汇组合;TF-IDF则用于评估词项在整个文档集合中的重要性,筛选出具有代表性的情感词;最后,朴素贝叶斯分类器根据这些特征进行情感分类。 实验部分,研究人员从食品网站抓取了84713条文本数据作为测试集,进行了正向和负向情感的分析。结果证明,PMI-Bayes算法相比于传统的PMI-IR和朴素贝叶斯算法,分类准确率提升了7.9%至8.7%(对于正向文本)和5.6%至6.0%(对于负向文本)。这表明该新方法在情感识别上的性能更优。 除了在网络食品安全领域,该算法还具有广泛的应用潜力,例如可以应用于社交媒体(如微博)和新闻评论的情感分析,帮助理解和评估公众对各种话题的情绪反应。这种情感倾向性分析工具对于政策制定者、企业以及公众来说都具有很高的实用价值,能及时获取和响应网络舆论,促进食品安全和公共信息透明度的提升。 本文提出的PMI-Bayes算法为网络舆情分析提供了一种新的高效工具,尤其在食品安全这一关键领域的应用,有助于提升食品安全监管的效率和效果。同时,通过与其他算法的比较,显示了其在情感分类任务上的优越性能,为文本挖掘和网络内容安全的研究提供了有价值的参考。