大学生数学建模竞赛:舆情分析与智能干预技术

需积分: 5 0 下载量 162 浏览量 更新于2024-06-17 收藏 1.59MB PDF 举报
该PDF文档详细探讨了"2020年第五届'数维杯'大学生数学建模竞赛论文——突发舆情事件分析及应对方法"。论文围绕四个核心问题展开研究: 1. 问题1:舆情情感倾向分析与筛选 - 首先,论文通过对附件1中的数据预处理,构建一个可供机器学习模型使用的语料库。 - 使用LDA(Latent Dirichlet Allocation)主题聚类模型对语料进行初步分析,确定每个主题簇的关键字。 - 利用Word2Vec模型,将主题关键词和簇关键词转化为向量表示,通过余弦相似度计算找到最相关的簇,从而对舆情信息进行初步筛选。 - 最后,通过关键词与语料的相似度计算,进一步精炼舆情信息。 2. 问题2:数据采集与信息抽取 - 设计了网络爬虫技术,高效收集网页数据,特别是与主题相关的标题、正文和时间等信息。 - 提出一种加权算法,结合网页布局相似度和模块面积来抽取关键内容,确保信息的完整性。 3. 问题3:对抗神经网络文本生成干预 - 应用对抗生成网络(GAN)构建文本生成模型,考虑主体和情感因素,通过多任务博弈训练生成与特定主体和情感相关的文本,以进行认知干预。 4. 问题4:无监督排序学习算法应用 - 基于主曲线排序理论,构建舆情事件演化评价指标体系,将舆情危机划分为五个等级。 - 通过无监督排序学习算法,对舆情事件进行安全态势评分,评估其危机等级。 论文在模型假设、定义与符号说明、模型的具体建立与求解等方面进行了深入探讨,展示了团队对舆情分析与应对策略的创新性思考和实践。这不仅有助于提升舆情管理效率,也为未来的舆情研究提供了新的视角和技术路径。