多特征融合的中文微博评价对象抽取方法提升情感分析精度

需积分: 10 1 下载量 49 浏览量 更新于2024-09-09 1 收藏 1.76MB PDF 举报
该篇论文研究的核心内容是"基于多特征融合的中文微博评价对象抽取方法",它针对中文微博情感分析这一关键任务展开。微博评价对象抽取对于情感分析至关重要,因为它能确定文本中表达情感的对象,如人名、产品名或事件等。论文首先认识到微博文本具有独特的特点,如短小、口语化和表情符号丰富,因此需要针对性的预处理策略。 预处理阶段,研究人员利用句法分析技术,识别出微博中的名词、名词短语以及热门话题,这些都被视为可能的评价对象候选集。句法分析在此起着关键作用,它能够帮助理解句子结构,提取潜在的评价主体。 接下来,论文提出采用两种模型进行特征融合筛选:一种是支持向量机(SVM)模型,另一种是加权模型。SVM模型以语义角色信息为特征,这种信息反映了词语在句子中扮演的角色,有助于识别评价对象。最小距离和词频也被纳入到特征考量中,词频可以反映词语在文本中的重要性,而最小距离则有助于定位评价对象的精确位置。 实验结果表明,这两种融合方法都展现出良好的性能。SVM模型在筛选后的F值达到了0.3573,而加权模型的F值更高,达到0.4059,这证明了多特征融合策略的有效性。这些数值是评估模型性能的重要指标,F值越高,模型的区分能力越强。 论文还提到了研究背景和资金支持,包括国家自然科学基金项目、北京市属高校创新团队项目、北京市教委专项项目和北京信息科技大学的研究生科技创新项目,这体现了该研究的学术价值和实际应用价值。 这篇论文提供了一种实用且有效的评价对象抽取方法,对于中文微博情感分析的精度提升具有重要意义,为后续的研究者在这个领域提供了新的思路和技术手段。