基于HNC理论的汉语动词连见计算机处理与规则研究

需积分: 5 1 下载量 181 浏览量 更新于2024-09-08 收藏 100KB PDF 举报
"这篇论文探讨了汉语中动词连见的计算机处理规则,基于概念层次网络(HNC)理论进行分类研究,并提出了相应的处理规则。此外,论文还介绍了一种形式化规则描述语言,该语言基于BNF范式和产生式规则,用于规则的软件实现。在这些规则的基础上,对实际语料中的动词连见句子进行了自动处理,并展示了处理结果。研究得到了国家‘973’资助项目和国家语言文字应用‘十五’资助项目的资金支持。" 在汉语中,动词连见是指在一个句子中两个或多个动词连续出现的情况,这种现象在语言学中具有复杂性,因为它涉及到语义理解、句法结构以及语境解读等多个方面。论文作者韦向峰和张全运用HNC(概念层次网络)理论,这是一种将概念、词汇和语义关系组织成层次结构的理论框架,旨在更准确地理解和处理自然语言中的复杂表达。 论文首先对动词连见的现象进行了深入的分类研究,识别出不同的动词连见模式,如并列、递进、因果等,每种模式都对应着特定的语义关系。然后,作者提出了针对这些模式的处理规则,这些规则对于计算机理解和解析汉语句子至关重要,因为它们提供了从结构到语义的转换路径。 为了使这些规则能够被计算机程序理解和执行,论文引入了一种形式化规则描述语言。这种语言基于巴科斯范式(BNF)和产生式规则,是编译原理中常用的形式化表示方法,可以清晰地表述复杂的语法规则。通过这种形式化描述,动词连见的处理规则被转化为计算机可读的语言,为软件实现奠定了基础。 在完成规则的形式化描述后,研究者利用这些规则对真实语料库中的句子进行了自动处理。这一步骤可能包括句法分析、语义消歧和生成处理结果。实验结果显示,这些规则能够有效地应用于实际文本,证明了所提方法的有效性和可行性。 论文的关键点在于,它不仅提供了对动词连见的理论分析,还给出了实用的解决方案,这对自然语言处理(NLP)领域,特别是中文NLP来说,具有重要的实践意义。通过这种方式,计算机可以更好地理解和处理汉语中的多动词结构,提高了自然语言理解和生成的准确性,这对于机器翻译、问答系统和聊天机器人等应用具有重大价值。