基于改进K-means的中文舆情分析系统设计与高精度实现

需积分: 10 5 浏览量更新于2024-08-23 收藏 640KB PDF 举报

该论文《基于主题发现的舆情分析系统的设计与实现》发表于2012年2月的北京联合大学学报(自然科学版)第26卷第1期，主要探讨了在互联网舆情监测领域的一个重要应用——舆情分析系统的构建。作者黄美漩针对中文分词、文本处理的关键技术进行了深入研究。首先，作者提出了一套完整的舆情分析系统，该系统由五个关键模块组成：中文分词是基础，它将非结构化的文本转化为可处理的形式；向量空间模型（VSM）用于表示文本的语义空间，通过计算词语之间的相似度来量化文本关系；特征提取是从大量文本数据中挑选出最具代表性的特征，以便后续处理；降维处理则是为了减少数据维度，提高计算效率，同时保持关键信息；最后，文本聚类用于识别和组织相似主题的信息，通过K-means改进算法进行群组划分。论文的核心创新在于提出的K-means改进算法，该算法在原有的基础上优化了聚类过程，旨在提升系统的查全率和查准率。这意味着改进后的算法能够更准确地识别和定位舆情热点，提供了更高稳定性的结果。作者通过实验证明，这种改进显著提高了舆情分析的准确性和效率，对于舆情监控和决策支持具有实际价值。这篇论文不仅阐述了舆情分析系统的设计思路和技术路线，还贡献了一个实用的算法优化策略，对于理解和应用自然语言处理在舆情分析中的作用具有重要意义。此外，它也符合自然科学领域的研究趋势，反映了在大数据时代下，如何利用数据挖掘和人工智能技术来处理和分析海量社交媒体数据的重要性。





















(



)

 ( )



   

[

收稿日期

]   

[

基金项目

] 

黎明职



度划课

( ) 。

[

作者简介

] 

黄美漩

(— ) ,

女

福泉州

黎明职机电

方向库技

、

挖掘

。

舆情析统

黄美漩

(

黎明职 机电

福 泉州

)

[

摘



要

] 

开发了一套由中文分词

、

向量空间模型建立

( ) 、

特征提取

、

降维处理和文本聚类

等模块组成的舆情分析系统

实现互联网舆情信息的主题发现

;

在舆情分析系统的实现过程中

提出了一种



改进算法

。

实验证明

改进后的算法在查全率和查准率上都有了一定的提

高

能够得到较高且稳定的准确率

。

[

关键词

] 

中文分词

;;

特征提取

;

文本聚类

[

中图分类号

] [

文献标志码

] [

文章编号

] ()

TheDesignandtheImplementationofthePublicOpinion

AnalysisSystem BasedonTopicDiscovery



(  , ,  , )

Abstract:  , ( )    

      

     , 

    

   

Key words:  ; ; ; 



引言

“

舆情

”

较各种象

、

问

表达信念

、

态度

、

意见情绪  表 

。

舆情迅速

 影响巨

。

织量开

互信息析

 突 公共

全面掌握情民意很意义

。

舆情析  核  技    舆情  析引擎

。



文析技

 文文聚



。

文批训练文  签

机

器文器

[  ]

它需 量训练样 作

先验 别  

因此不  适  互   信息  



、

化快别层不穷 

。

而文聚 

无需训练样 

 划      

 够   

面向段间代表文 

 

阶段互

。

前

  许  专 

、

 者就舆情  析技

若干改 法

陆蓓

[  ]



种改蚁群聚热    法

;

杨震

[  ]

舆情析 

 

串似聚短文舆情热  技 

;

李

若鹏

[  ]

则把 密度 聚想引 传统





法





聚法

。

见

效

海量信息速度 确率

必须找

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38641561

粉丝: 5
资源: 943

基于改进K-means的中文舆情分析系统设计与高精度实现

基于Python的舆情分析系统设计与实现源码+文档说明（毕业设计项目）

人工智能-舆情管控-基于Python的网络舆情分析系统

基于python的网络舆情分析系统设计与实现.docx

基于大数据的网络舆情分析系统设计与实现.zip

网络游戏-基于复杂网络的舆情分析系统设计与实现.zip

基于Python微博舆情分析系统的设计与实现+毕业论文

基于数据挖掘的城市旅游舆情分析系统设计与实现.pdf

基于Twitter大数据处理的境外舆情分析系统设计与实现.pdf

基于Python微博舆情分析系统的设计与实现源码+论文文档（个人高分毕设）

基于python的网络舆情分析系统设计与实现

最新资源