CCKS2019金融事件主体抽取：BERT多模型融合策略

需积分: 0 84 浏览量更新于2024-08-05 收藏 330KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"CCKS2019面向金融领域的事件主体抽取比赛的参赛团队采用了基于BERT的多模型融合策略，构建了多个从简单到复杂的编码-解码学习器，并通过集成学习来提升整体性能。他们取得了A榜0.92620的最高成绩和B榜0.82816的最高成绩。" 事件主体抽取是自然语言处理中的关键任务，特别是对于金融领域，它的目标是识别出文本中特定事件类型的主体，如公司和机构。在CCKS2019的金融领域事件主体抽取任务中，研究者们面临的挑战是抽取出21种预定义的事件类型，包括交易违规、投诉维权、涉嫌欺诈和财务造假等。传统上，事件抽取有两种主要方法：基于模式匹配和基于机器学习。模式匹配方法受限于文本的具体形式，难以适应变化，而机器学习方法，尤其是有监督学习，已成为主流。在有监督学习框架下，事件抽取被视为一个多分类问题，通过提取特征并训练分类器来实现。在本次研究中，团队采用了BERT（Bidirectional Encoder Representations from Transformers）作为基础模型。BERT是一种预训练语言模型，它通过双向Transformer层捕获上下文信息，对于理解文本语义非常有效。为了提高模型的性能，他们设计了多种不同的学习器，每个都基于编码-解码架构。这种架构通常包括一个编码器负责理解输入序列，一个解码器用于生成输出序列，例如事件的主体。集成学习是将多个学习器的结果进行综合，以提升整体预测准确性的技术。在本文的实验中，团队将这些基于BERT的编码-解码学习器融合在一起，利用集成学习策略来减少单个模型的误差，从而达到更好的性能。这种方法能够结合不同模型的优点，增加鲁棒性，降低过拟合风险。最终，这种多模型融合策略在A榜和B榜上分别取得了0.92620和0.82816的最高成绩，证明了该方法的有效性。这不仅为金融领域事件主体抽取提供了有力的解决方案，也为其他领域的事件抽取任务提供了有价值的参考。

资源详情

资源推荐

CCKS 2019

面向金融领域的事件主体抽取比赛

task4:

基于

BERT

的多模型融合的事件主体抽取模型

李振

, 刘恒

, 赵兴莹

, 李毓瑞

, 秦培歌

民生科技有限责任公司，北京 101300，中国

lizhen, liuheng, zhaoxingying, liyurui, qinpeige@mskj.com

摘要

. 本文报告了本团队在CCKS 2019面向金融领域的事件主体抽取任务

的提交。本文遵循从简单到复杂的思想设计多个学习器，并基于集成学习

的思想将多个学习器进行融合，其中每个学习器采用编码-解码的思路进

行设计。最终，模型在A榜最高成绩达到0.92620，排名第11位，在B榜最

高成绩达到0.82816，排名第17位。

Keywords: 模型融合,编码-解码, BERT

引言

事件抽取是从描述事件信息的文本中抽取出用户感兴趣的事件信息并以结构化

的形式呈现出来。它不仅是构建知识图谱的关键任务，也是自然语言处理的难

点和热点问题之一，在自动文摘、自动问答、信息检索等领域有着广泛的应

用。本文所研究的面向金融领域的事件主体抽取任务，是事件抽取任务中的限

定域事件抽取。任务的目标是从一段金融事件文本中抽取出发生特定事件类型

的主体，主体范围限定为：公司和机构，事件类型共有21种，包括交易违规、

投诉维权、涉嫌欺诈和财务造假等。

限定域事件抽取是在进行抽取之前，预先定义好目标事件的类型。限定域

事件抽取是信息抽取和知识图谱构建的重要环节之一，受到了学术界和产业界

的广泛关注，研究者针对该任务进行了大量的研究。目前，对于限定域事件抽

取主要有两种方法：基于模式匹配的方法和基于机器学习的方法。基于模式匹

配的方法是在一些模式的指导下进行某种类型的事件的识别和抽取。由于基于

模式匹配的方法依赖于文本的具体形式（语言、领域和文档格式等），且制定

的模式很难覆盖所有的事件类型，当语料发生变化时，需要重新获取模式，因

此基于机器学习的事件主体抽取成为主流方法。基于机器学习的事件抽取方法

中最具有代表性的是基于有监督学习的事件抽取，即将事件抽取建模成一个多

分类问题，提取特征向量后再使用有监督的分类器进行事件抽取。本文采用基

于有监督学习的方法从金融事件文本中抽取事件主体。

模型的整体设计思路是设计从简单到复杂的多个学习器，基于集成学习的

思想将多个学习器结合起来，从而获得更好的性能。首先，以BERT+FC作为基

准模型，添加一层self-attention作为编码器，构建BERT+self-attention+FC模型。

下载后可阅读完整内容，剩余7页未读，立即下载

东方捕

粉丝: 20
资源: 310

CCKS2019金融事件主体抽取：BERT多模型融合策略

CCKS2020-Entity-Linking:2020年CCKS

pytorch实现基于BERT的中文新闻事件抽取项目源码.zip

我需要一段基于BERT的金融事件因果关系抽取的Python代码和研究思路。

我需要一段基于bert模型的文本因果关系抽取的python代码

《huggingface自然语言处理详解——基于bert中文模型的任务实战》源码

基于Bert的关系抽取模型

基于bert模型的商品评论情感分析系统中bert模型的应用

python bert模型实体抽取

基于BERT模型的自然语言处理实战

基于bert模型的自然语言处理实战 源码

opennre 使用的基于bert的中文实体关系抽取模型框架是哪一个

基于pytorch的bert_crf实体关系抽取

基于bert模型的自然语言处理实战 配套资源代码在哪里

基于bert的关键词生成模型

用什么模型来微调基于bert训练的模型

bert预训练模型抽取文本特征

ERNIE模型和bert模型的区别

基于大模型的信息抽取

基于Bert模型的中英混合评论的情感倾向分类

使用bert-bilstm进行实体抽取

最新资源

基于bert模型的自然语言处理实战源码

基于bert模型的自然语言处理实战配套资源代码在哪里