结合CGAN与WGAN-GP的命名实体识别CWGAN模型研究

需积分: 0 193 浏览量更新于2024-08-05 收藏 1.6MB PDF 举报

本文主要探讨了命名实体识别领域的创新方法，即结合条件生成式对抗网络（Conditional Generative Adversarial Networks, CGAN）和改进的Wasserstein生成式对抗网络（Wasserstein Generative Adversarial Network with Gradient Penalty, WGAN-GP）来设计一种适用于命名实体识别任务的条件Wasserstein生成式对抗网络模型（Conditional Wasserstein Generative Adversarial Network, CWGAN）。研究者们受到CGAN中以文本描述作为条件生成图像概率分布的启发，将这个理念应用于命名实体识别任务，即通过句子序列作为条件，来生成对应的标注序列的概率分布。在模型架构上，生成器和判别器均采用了双向长短时记忆网络（Bidirectional Long Short-Term Memory, BiLSTM）进行处理。生成器的目标是生成命名实体标签的概率分布，而判别器则负责评估生成的标签质量，并通过反馈机制调整生成器，使其能够逐步提高生成标签概率分布的精确度。此外，CWGAN引入了梯度惩罚机制，以确保在反向传播过程中梯度的稳定性，通过最小化真实样本分布与生成样本分布之间的Wasserstein距离，优化模型的目标函数。论文强调了这种方法的有效性和优越性，通过实验验证了其在命名实体识别任务中的性能。实验结果表明，该模型能够在一定程度上提高命名实体识别的准确性，且具有较好的鲁棒性和稳定性。此外，研究成果还得到了国家自然科学基金青年基金项目和河北省高等学校科学技术研究青年基金项目的共同资助，显示出研究团队对该领域深入探索的决心和对学术研究的支持。这篇论文对于命名实体识别的生成式对抗网络技术进行了创新性的应用和优化，不仅提升了模型在实际任务中的表现，也为相关领域的研究者提供了新的视角和方法参考。

小型微型计算机系统

Journal of Chinese Computer Systems

2019

年

月第

期

Vol． 40 No． 6 2019

MUC． http: / /en． wikipedia． org． wiki /Message_Understanding_Conference．

ACE． http: / /en． wikipedia． org． wiki /Automatic_Content_Extraction．

收稿日期

: 2018-08-28

收修改稿日期

: 2018-09-26

基金项目

国家自然科学基金青年基金项目

( 61602401)

资助

;

河北省高等学校科学技术

研究青年基金项目

( QN2018074)

资助

．

作者简介

冯建周

(

通讯作者

) ，

男

，1978

年生

，

博士

，

副教授

，CCF

高级会员

，

研究方向为知识图谱

、

语义

web;

马祥聪

，

男

，1994

年生

，

硕士

，

研究方向为知识库补全

;

刘亚坤

，

男

，1997

年生

，

研究方向为命名实体识别

、

实体关系抽取

;

宋沙沙

，

女

，1992

年

生

，

硕士

，

研究方向为命名实体识别

、

实体关系抽取

．

关于命名实体识别的生成式对抗网络的研究

冯建周

，

马祥聪

，

刘亚坤

，

宋沙沙

(

燕山大学信息科学与工程学院

，

河北秦皇岛

066004)

(

燕山大学河北省软件工程重点实验室

，

河北秦皇岛

066004)

E-mail: fjzwxh@ ysu． edu． cn

摘要

本文结合条件生成式对抗网络

( CGAN)

和改进的

Wasserstein

生成式对抗网络

( WGAN-GP) ，

提出一种适合于命名实

体识别任务的条件

Wasserstein

生成式对抗网络模型

( CWGAN) ．

该模型借鉴

CGAN

以文本描述为条件的图像概率分布的思

想

，

来完成以句子序列为条件获得标注序列概率分布的任务

．

该模型的生成器和判别器都采用

BiLSTM

结构

，

不同的是生成器

生成命名实体标签的概率分布

，

判别器则为生成器的生成质量打分并反馈给生成器

，

生成器根据反馈更新梯度从而提升生成标

签概率的质量

．

另外

，CWGAN

采用梯度惩罚的方法来保证梯度在反向传播的过程中保持平稳

，

通过拉近真实样本分布和生成

样本之间的

Wasserstein

距离

，

优化目标函数

．

最后通过实验验证了该方法的可行性和优越性

．

关键词

命名实体识别

;

生成式对抗网络

; BiLSTM; Wasserstein

距离

; CWGAN

中图分类号

: TP311

文献标识码

: A

文章编号

: 1000-1220( 2019) 06-1191-06

Ｒesearch on Generative Adversarial Networks of Named Entity Ｒecognition

FENG Jian-zhou，MA Xiang-cong，LIU Ya-kun，SONG Sha-sha

( Yanshan University College of Information Science and Engineering，Qinhuangdao 066004，China)

(

Yanshan University Key Laboratory of Hebei Softw are Engineering，Qinhuangdao 066004，China)

Abstract: This paper proposed a Generative Adversarial Nets suitable for the task of named entity recognition named Conditional Was-

serstein Generative Adversarial Nets( CWGAN) ，inspired from Conditional GAN and improved Wasserstein GAN．Ｒelative to the im-

age probability distribution conditioned on textual description in CGAN，CWGAN obtains the NEＲ label sequence probability distribu-

tion conditioned on sentence sequences． Both the generator and the discriminator use a bidirectional LSTM network． The difference is

that the generator generates the probability distribution of the named entity tags，and the discriminator scores the generation quality of

the generator and feeds it back to the generator． The generator updates the gradient according to the feedback to improve the quality of

the probability of generating tags． In addition

，this paper use gradient penalty in improved Wasserstein GAN to ensure that the gradient

remains stable during backward propagation． Meanwhile

，this paper use the mean which decrease the Wasserstein distance between real sam-

ple distribution and generate sample ensure that the target functio n is optimized． Experiments show that the C WGAN model we proposed is

effective in the task of named entity recognition． Finally，the feasibility and superiority of the method are verified by experiments．

Key words: named entity recognition; generative adversarial networks; bidirectional LSTM; w asserstein distance; conditional wasser-

stein generative adversarial nets

( CWGAN)

引言

互联网的快速发展使网络信息呈爆发式增长

，

同时网络

信息的形式也变得越来越多样化

，

这给用户有效利用网络信

息资源带来了很大的不便

．

面对网络信息爆发式增长带来的

挑战

，

信息抽取技术逐渐发展起来

．

信息抽取是指从大规模的

无结构文本中提取出用户真正感兴趣的信息

，

并以结构化或

半结构化的形式存储或输出

［1］

．

信息抽取技术起源于

世纪

年代早期对自然语言处

理

( Natural Language Processing，NLP)

的研究

，

而后从

世纪

年代中期开始蓬勃发展起来

，

这得益于消息理解会议

( Message Understanding Conference，MUC)

的推动

．

继

MUC

之后

，

自动内容抽取

( Automatic Content Extraction，ACE)

评

测会议也对信息抽取技术的发展起着关键性的作用

．

根据

ACE

的划分

，

信息抽取主要包括

个方面的研究

命名实体识别

、

指代消解

、

实体关系抽取和事件抽取

．

其中

，

命

名实体识别

( Named Entity Ｒecognition，NEＲ)

是这些任务中

最关键的部分

．

这是因为命名实体识别是

NLP

领域中一些复

杂任务

(

如机器翻译

、

问答系统

、

信息检索等

)

的基础

．

同时命

名实体识别

又是实体关系抽取的基础

．

例如

，

在机器翻译中

，

下载后可阅读完整内容，剩余5页未读，立即下载

稚气筱筱

粉丝: 19
资源: 320

结合CGAN与WGAN-GP的命名实体识别CWGAN模型研究

MIT 2018学习资料

命名实体识别的条件Wasserstein生成式对抗网络模型

提升文本英语水平的句子扩展模型研究

命名实体识别实战：机器学习方法与应用全览

生成式对话模型研究进展

神经网络在生成式问答系统中的应用

实体识别中的无监督学习：在数据中发现实体的7种方法

实体识别深度教程：揭秘NLP领域的10大挑战与机遇

RNN与文本生成：掌握循环神经网络的应用

【NLP中的对抗策略】：对抗训练在自然语言处理中的应用

最新资源