事件片段时序识别算法：4%提升的准确性

24 浏览量更新于2024-08-28 收藏 536KB PDF 举报

本文主要探讨了"基于新闻事件片段的时序关系识别方法"，这一研究关注的是如何有效地处理新闻文本中的事件序列分析。在现代信息社会，随着搜索引擎分析技术的提升和数据挖掘技术的广泛应用，理解事件之间的时序关系变得尤为重要，这不仅有助于新闻聚合、舆情分析，还能支持更深入的信息理解和决策支持。论文首先定义了事件片段作为新闻文本处理的基本单元，这是对传统文本分析的一个创新性划分，因为它允许对复杂新闻事件进行更为精细和有序的结构化处理。作者提出了一种两阶段的事件片段时序关系识别算法，该算法分为两个核心步骤：第一阶段是时序映射，即对文本中的事件片段进行时间顺序的标注或编码，以便于后续的分析；第二阶段则是时序识别，通过算法模型识别这些事件片段之间的逻辑关系，可能是因果、并列、递进等。在实证研究部分，作者利用真实网络新闻数据集进行了算法性能的评估。对比实验结果显示，相比于传统的分类器和强规则算法，这种方法在时序关系识别的准确性上有了显著提升，达到了4%的绝对优势。这种改进对于提高新闻事件的理解和分析效率具有重要意义，特别是在大规模新闻处理和实时监控场景中。值得注意的是，文中提到的关键词“全局优化”可能指的是在算法设计中对整个事件序列关系识别过程的优化，确保了整体识别效果的最优化，而不是孤立地看待每个事件片段。这涉及到搜索空间的高效探索、模型参数的调优以及可能的机器学习策略，如深度学习或强化学习，来找到最佳的时序关系配置。这篇文章为新闻事件的时序关系识别提供了一种新颖且高效的解决方案，通过细致的事件片段划分和优化的识别流程，能够在处理大量新闻数据时捕捉到事件间的动态联系，为相关领域的研究和应用提供了有价值的技术支撑。

2017 年 6 月 Chinese Journal of Network and Information Security June 2017

00171-1

第 3 卷第 6 期网络与信息安全学报 Vo l . 3

No.6

基于新闻事件片段的时序关系识别方法

李英俊，张宏莉，王星

（哈尔滨工业大学计算机科学与技术学院，黑龙江哈尔滨 150001）

摘要：针对新闻文本，将事件片段定义为最小划分单元，提出了一个两阶段的事件片段时序关系识别算法，

第一阶段时序映射和第二阶段时序识别。使用真实网上新闻数据进行实验，结果表明，所提方法相比普通的

分类器及强规则算法，准确率提高了 4%。

关键词：事件片段；时序映射；时序关系识别；全局优化

中图分类号：TP393

文献标识码：A

doi: 10.11959/j.issn.2096-109x.2017.00171

Temporal relation recognition method

based on news event fragments

LI Ying-jun, ZHANG Hong-li, WANG Xing

(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)

Abstract: Event fragments as the smallestr unit was defined and a two-stage event fragments temporal relation rec-

ognition algorithm was proposed. The first stage is sequential mapping and the second is sequence recognition. The

real online data increased accuracy by 4% compared to common classifier and strong rule algorithm.

Key words: event fragments, sequential mapping, temporal relation reconition, global optimization

1 引言

随着搜索引擎分析技术的提高、数据挖掘技

术的发展，事件时序识别逐渐成为研究热点。事

件是指在特定时间和环境下，某种行为或状态的

描述

[1]

。从时间角度上看，事件可能发生在一个

时间区间或持续一段时间。因此，事件之间会存

在一定的先后顺序。事件的时序关系识别是根据

事件时间线索特征进行事件时间位序识别。对于

新闻类的文本而言，其中包含多个事件和时间，

通过事件−时间的对应以及事件时序识别，可以更

好地分析理解文本内容。

例如，一篇新闻一般除了包含一个主题外，

还包含多个事件，如表 1 中的例 1 所示，文本是

节选自一篇新闻，事件分别用“「」”标示出来，

对应的发生时间用下划线标出。从一篇新闻里抽

取出多个事件，并对这些事件发生时间进行排序，

即事件时序关系识别。现有研究主要集中在句内

事件

−

时间关系和相邻句中主要事件的时间关

系。句内事件

−

时间关系识别是对同一个句子中

事件和时间表达式关系识别，如表 1 中的例 2 所

示，“投资”和“近年”的关系是有交叉或投资发

收稿日期：2017-04-07；修回日期：2017-05-10。通信作者：李英俊，lyjamare@163.com

基金项目：国家自然科学基金资助项目（No.61402137）；国家重点基础研究发展计划（“973”计划）基金资助项目（

2013CB329602）

Foundation Items: The National Natural Science Foundation of China (No. 61402137), The National Basic Research Program

of China (973 Program) (No. 2013CB329602)

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38668672

粉丝: 6
资源: 907

事件片段时序识别算法：4%提升的准确性

基于深度学习的出行模式识别方法.pdf

基于时序行为检测的工作流识别.docx

基于动态异构信息网络的时序关系预测

基于cnn的语音识别tensorflow

ASRT实时语音识别

基于CNN-LSTM和自我注意机制的音乐情感分析

帮我详细的写一篇高并发时序数据存储的专利

synplify时序约束

CTPN在自然场景文字检测中的优势是什么，其工作原理与传统方法有何不同？请结合《深度解析：OCR中的文字检测与识别技术(CTPN与CRNN)》给出详细解答。

时序序列趋势算法MK

最新资源