中文新闻情感摘要:融合情感与主题的文本摘要方法

需积分: 13 2 下载量 198 浏览量 更新于2024-09-07 收藏 1.13MB PDF 举报
本文研究关注于中文新闻文本情感摘要,一种旨在提炼和浓缩文本情感倾向的关键信息的技术。在当前的研究背景下,传统的文本摘要方法往往忽视了情感因素,导致生成的摘要可能无法准确反映文本的情感色彩。论文提出了一种融合句子情感和主题相似性的新方法来改进这个问题。 首先,研究团队对新闻文本中的每个句子进行情感标注,这是情感摘要的关键步骤,它能捕捉到句子中的主观情绪信息。这一步骤对于理解文本的情绪基调至关重要,使得摘要不仅仅是基于事实的陈述,而是包含了作者或说话者的情感态度。 接下来,他们将情感信息引入LexRank算法,这是一种常用的文章重要性排序算法。通过考虑句子之间的不仅限于主题相关性,还结合了情感相似性,使得算法能够更精确地评估句子在情感上的关联性。这有助于确保摘要不仅包含主要观点,还反映了文本的核心情感。 进一步,论文注意到新闻标题在传达文本主旨和情感上的特殊性,因此,研究者计算了句子与标题的相似性。这种策略强化了摘要与原文的紧密联系,使得情感摘要更加贴近文本整体的情感氛围。 实验结果显示,新提出的融合情感和主题相似性的方法在ROUGE-1、ROUGE-2和ROUGE-W这三个衡量摘要质量的重要指标上都优于传统的LexRank算法,证实了同时考虑情感信息和主题信息的有效性。这表明,生成的情感摘要更能体现文本的主要观点和情感倾向,对于用户快速理解新闻的情感立场具有更高的价值。 论文作者来自南华大学计算机科学与技术学院,他们的研究领域涵盖了自然语言处理、信息检索、知识发现等多个方面,共同为提高中文新闻情感摘要的质量做出了贡献。这项工作不仅有助于新闻阅读者更好地理解和解读信息,也对文本挖掘和信息处理领域的研究有着重要的推动作用。