基于最大熵模型的人称名词短语单复数消解优化

需积分: 5 136 浏览量更新于2024-08-13 收藏 256KB PDF 举报

本文主要探讨了中文人称名词短语在处理单复数属性信息时所面临的挑战，以及如何通过最大熵模型进行改进来提升人称代词消解的准确性和效率。在传统的代词消解工作中，人称名词短语的单复数信息往往被忽视，因为这方面的信息在自然语言中的确不易确定，这对指代消解的性能有一定影响。作者提出了一种基于改进最大熵模型的新方法，该模型特别关注了人称名词短语的单复数属性。在原有特征的基础上，他们新增加了三种特征：Head特征，用于捕捉名词短语的中心词；Qun特征，可能涉及名词短语的数量信息；以及Len特征，衡量名词短语的长度。这些附加特征有助于模型更准确地判断人称代词与其先行词之间的关系，特别是对于那些在单复数形式上模棱两可的人称名词短语。在实验设计中，研究者将这种方法应用到真实文本环境中，与那些不利用单复数属性信息的传统方法进行了对比。结果显示，新模型的F值（F-score，一种衡量模型精确度和召回率综合性能的指标）相比于传统方法有所提升，表明了加入单复数信息特征对提升人称代词消解性能的有效性。本文的研究不仅关注了自然语言处理中的一个具体问题，即单复数消解，还展示了如何通过统计学习方法——最大熵模型，来优化语言理解任务。这对于理解和改善现代自然语言处理系统，尤其是在机器翻译、问答系统和文本理解等领域，具有重要的理论和实际意义。这篇文章提供了一个实用的策略，即利用最大熵模型增强对中文人称名词短语单复数属性的理解，从而提高代词消解的准确性和泛化能力，对推动汉语自然语言处理技术的发展有着积极的推动作用。

第

卷第

期

2009

年

月

江南大学学报(自然科学版)

Journal

Jiangnan

University(

Natural

Science

Edition)

人称名词短语单复数信息和

最大恼模型的指代消解

钟丹

朱倚

李梅

程显毅*

1 ,2

8 No.6

Dec.

2009

(1.江苏大学计算机科学与通信工程学院，江苏镇江

212013

南通大学计算机科学与技术学

院，江苏南通

226019)

摘

要:针对中文人称名词短语单复数属性信息不明确，对消解贡献低的问题，利用改进的最大煽

模型提出了人称代词消解新的模型。该模型在原有特征的基础上增加了人称名词短语单复数识别

的

Head

特征、

Qun

特征和

Len

特征。在真实文本环境下与不使用单复数属性信息方法进行了对比

实验，结果表明该方法的

值与不使用单复数属性信息方法的

相比有一定的提高。

关键词:人称代词消解;人称名词短语单复数;最大精;指代消解

中图分类号

:TP

319.4

文献标识码

文章编号

:1671

一

7147

(2009 )06 -

0666

Research

Singular

and

Plural

Information

and

Maximum

Entropy

Model

for

Personal

Noun

Phrases

ZHONG

Dan

ZHU

Qian

, LI Mei

CHENG

Xian-yi

叫，

(1.

School

Computer

Science

and

Communication

Engineering , Jiangsu University , Zhenjiang

212013

, China;

School

Computer

Science ,

Nantong

University ,

Nantong

226019

, China)

Abstract:

To solve

the

problem

whether

Chinese

personal

pronouns

noun

phrase

singular

pluralism

is not

obvious

which

contributes

less

anaphora

resolution

the

paper

presents

a new

model

for

personal

pronouns

anaphora

resolution

based

improved

maximum entropy

mode

The

model

mainly

adds

Head

character

Qun

character

and

Len

character

original

characteristics

that

can

recognize

the

personal

pronouns

noun

phrase

singular

plura

The

contrast

experiment

shows

that

the

algorithm

presented

the

paper

has

better

value.

Key

words:

personal

pronouns

resolution

person

singular

and

plural

noun

phrase

maximum

entropy

anaphora

resolution

随着篇章处理技术的广泛应用，汉语中指代消

解问题逐渐成为研究热点

[1]

指代消解在机器翻

译、信息抽取、自动文摘以及自动问答等领域中都

收稿日期

:2009

一

;

修订日期

:2009

。

基金项目:江苏省研究生创新计划项目

(CX098

203Z)

。

有重要应用

[2]

。由于中文是属于汉藏语系，只承担

表示事物数量特征的表义功能，对于计算机而言，

名词的单复数识别有一定的难度

作者简介:钟丹(1

978

，女，江苏镇江人，计算机应用专业硕士研究生。

*通讯作者:程显毅

(1956

一)

，男，黑龙江哈尔滨人，教授，博士生导师。主要从事人工智能应用基础、自然语言理

解等研究。

Email:

xycheng@ntu.edu.cn

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38738983

粉丝: 5
资源: 872

基于最大熵模型的人称名词短语单复数消解优化

最大熵模型理解.pdf

最大熵模型.pdf

maxent.rar_maxent_最大熵_最大熵 模型_最大熵 预测

逻辑回归与最大熵模型

最大熵马尔科夫模型与隐马尔可夫模型和最大熵模型之间的关系

用iris数据模拟最大熵模型

maxent最大熵模型

logistic regression模型和最大熵模型的区别

最大熵模型python代码

如何结合使用最大熵模型和CRF++在Python中进行汉语分词和词性标注？

最新资源

maxent.rar_maxent_最大熵_最大熵模型_最大熵预测