DBN+ACD: 改进深度置信网络提升中文实体检测性能

12 浏览量更新于2024-08-31 收藏 1.48MB PDF 举报

在当前的IT领域，中文实体检测作为自然语言处理中的关键任务，其目标是从大量的非结构化文本中识别并提取出具有特定意义的实体，如人名、地名和组织名等。这是一项重要的实用技术，尤其是在互联网大数据时代，对于信息检索、知识图谱构建以及智能应用的提升具有显著价值。本文重点讨论了基于深度置信网络（Deep Belief Networks，DBN）的中文实体检测方法。DBN是一种深层次的生成模型，其核心组成部分是受限玻尔兹曼机（Restricted Boltzmann Machine，RBM）。传统的RBM训练通常采用对比散度准则（Contrastive Divergence，CD），然而，CD是一种对数似然梯度的近似，存在一定的偏差。作者针对这一问题，提出了基于平均对比散度准则（Average Contrastive Divergence，ACD）的DBN实体检测模型。通过利用大规模的MSRA语料库进行训练，这种方法采用了词袋模型作为输入向量，同时结合词性特征和上下文特征，以增强模型的表达能力和准确性。实验结果表明，相比于传统的CD准则，ACD不仅能够提供更佳的实体检测性能，而且在重构误差和收敛性方面也有所改善。与基于规则的方法相比，机器学习方法如DBN更具有灵活性和普适性，它不需要人工构建复杂的语法规则，而是通过学习数据中的模式自动进行实体分类。尤其是使用ACD训练的DBN，其在处理大量文本数据时展现出更强的适应性和效率。总结来说，这篇论文展示了深度置信网络在中文实体检测领域的应用潜力，特别是在优化训练策略方面，平均对比散度准则的引入有助于提高模型的性能和稳定性。这对于推动自然语言处理技术在实际应用中的落地和进一步发展具有重要意义。

收稿日期：2019-06-10 稿件编号：201906048

作者简介：秦磊（1996—），男，湖北荆州人，硕士研究生。研究方向：自然语言处理。

随着我国互联网事业的发展，网络上每时每刻

都在产生巨量的非结构文本信息，如何能将这些非

结构文本转换为机器便于识别的结构化信息成为自

然语言处理领域的一个热点。实体检测作为自然语

言处理的重要部分，得到了许多关注。

命名实体（Named Entity，NE）作为一个明确的概

念和研究对象，是在 1995 年 11 月的第六届 MUC 会议

（MUC-6，the Sixth Message Understanding Conferences）

上被提出的

[1-2]

。中文实体检测是指从互联网上大规

模无结构的文本中提取出中文命名实体如人名、地

名、组织名。实体检测的方法主要分两类，基于规则

和基于机器学习

[1- 3]

。基于规则的方法是人工构建

语法规则，再从文本中匹配这些规则的字符串，但是

语法规则繁多，有的规则比较复杂，这种方法的迁移

性也比较差。基于机器学习的方法即是把实体检测

的任务当作分类的任务处理。

深度置信网络（Deep Belief Nets，DBN）是 2006

基于改进深度置信网络的中文实体检测

秦磊

1，2

，汤鲲

2，3

（1.南京烽火天地通信科技有限公司江苏南京 210019；2.武汉邮电科学研究院湖北武汉 430074；3.南京烽

火星空通信发展有限公司江苏南京 210000）

摘要：实体检测是自然语言处理的一个研究热点，是从无结构的文本中检测出命名实体。深度置

信网络（Deep Belief Nets，DBN）的核心组件为受限玻尔兹曼机（Restricted Boltzmann Machine，RBM），

RBM 的训练传统采用对比散度准则（Contrastive Divergence，CD），但 CD 是对数似然梯度有偏差的

近似。为此，提出基于平均对比散度准则（Average Contrastive Divergence，ACD）训练的 DBN 的实体

检测模型，利用 MSRA 语料库作训练。采用词袋模型作为输入向量，结合词性特征以及上下文特

征。并将其与传统的 CD 准则作对比。实验证明，DBN 能获得较好的实体检测效果，并且 ACD 准则

比 CD 准则能获得更好的重构误差，且收敛性更好。

关键词：实体检测；深度置信网络；对比散度；平均对比散度

中图分类号：TP391.1 文献标识码：A 文章编号：1674-6236（2020）03-0038-05

DOI：10.14022/j.issn1674-6236.2020.03.009

Chinese entity detection based on improved Deep Belief Nets

QIN Lei

1，2

，TANG Kun

2，3

（1.Nanjing Fiber Home World Communication Technology Co.，Ltd.，Nanjing 210019，China；2. Wuhan

Research Institute of Posts and Telecommunications，Wuhan 430074，China；3. Fiber Home Starry Sky Co.，

Ltd.，Nanjing 210000，China）

Abstract: Entity detection is a research hotspot of natural language processing. It is to detect named

entities from unstructured text. The core component of Deep Belief Nets is the Restricted Boltzmann

Machine. RBM training tradition uses Contrastive Divergence，but CD is an approximation of the log-

likelihood gradient with bias. To this end，an entity detection model of DBN based on ACD training is

proposed，and the MSRA corpus is used for training. The word bag model is used as an input vector，

combined with part of speech features and context features. And compare it to the traditional CD

guidelines. Experiments show that DBN can obtain better entity detection，and ACD criterion can obtain

better reconstruction error and better convergence than CD criterion.

Key words: entity detection；Deep Belief Nets；contrastive divergence；average contrastive divergence

电子设计工程

Electronic Design Engineering

第 28卷

Vol.28

第 3期

No.3

2020年 2 月

Feb. 2020

-- 38

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38679651

粉丝: 6
资源: 934

DBN+ACD: 改进深度置信网络提升中文实体检测性能

深度置信网络DBN

DBN深度置信网络源代码

深度置信神经网络的matlab代码

基于OpenCV4的人脸检测与识别

深度学习目标检测技术：Faster R-CNN算法常见问题解答，解决目标检测难题

实体识别错误分析与优化：深入理解并解决常见问题

NLP异常检测：3种方法确保文本处理的精准性

OpenCV人脸检测在电子商务中的应用：打造个性化购物体验

机器学习算法在金融领域的应用：风险管理、欺诈检测与投资策略

【客户画像精准构建】：关联规则挖掘与网络分析的结合运用

最新资源