事件卷积特征提升新闻文本分类效果

需积分: 10 0 下载量 193 浏览量 更新于2024-09-07 收藏 964KB PDF 举报
“基于事件卷积特征的新闻文本分类.pdf”这篇论文主要研究的是如何改进卷积神经网络(CNN)在文本分类任务上的表现,特别是针对新闻文本。传统的CNN模型通常依赖于n-gram的顺序特征,但这种方法忽略了文本中长距离的依存关系和句法结构,以及语义信息。论文提出了一种新的方法,即利用事件卷积特征来增强模型的能力。 事件卷积特征是通过分析文本的依存关系来抽取出的,这些事件代表了句子中的核心动作或状态,具有丰富的语义含义。这种方法首先通过依存句法分析抽取文本中的事件集合,然后利用CNN对这些事件进行特征提取。这样做可以捕获到句子中的关键信息,而不仅仅是局部的n-gram模式。在对中文新闻语料的多类别分类实验中,这种基于事件卷积特征的文本分类方法相较于传统的文本分类方法和仅使用n-gram的CNN模型,表现出更优的性能和稳定性。 论文的作者包括夏从零、钱涛和姬东鸿,他们分别来自武汉大学计算机学院,研究领域涵盖了自然语言处理、数据挖掘和机器学习。实验结果证实了所提出的模型在文本分类任务上的有效性,同时也强调了事件特征在理解和分析文本中的重要作用。 关键词:文本分类、事件、卷积神经网络、自然语言处理。该研究对于理解如何更好地利用语义信息来提升深度学习模型在文本理解任务上的表现有着重要的理论和实践价值,为后续的研究提供了新的视角和方法。通过引入事件概念,模型能够更深入地理解文本的内在结构,从而提高分类的准确性和鲁棒性。这对于新闻分析、信息检索、情感分析等领域都有潜在的应用前景。