构建全面细致的兼语句式分类体系:97.78%语料扩充准确率

需积分: 0 0 下载量 16 浏览量 更新于2024-09-07 收藏 971KB PDF 举报
本文主要探讨了兼语句式在文本知识获取中的重要性,并针对这一研究方向提出了一种新颖的兼语语义类的分类方法。论文首先从句中第一个谓词的角度出发,将兼语句式划分为八个主要类别,这些类别基于语义分类和描述框架,确保了分类的细致性和准确性。接着,作者关注于兼语中第二个谓词的时间顺序,对这八个大类进行了深入的细分和归纳,这有助于揭示兼语结构的内在规律。 分类过程中,作者特别注意到了那些不能作为兼语句式中第一个谓词成分的语义类,通过深入分析这些语义类在层级上的特性,探究了它们存在的原因和潜在规则。这种分类方法相较于现有的体系更为全面,几乎覆盖了文本知识中所有类型的兼语句,显示了其广泛适用性。 实验结果显示,新提出的分类体系在实际应用中的语料扩充正确率高达97.78%,显示出其高效性和有效性。这对于文本知识的处理和理解具有重要意义,特别是在自然语言处理和大规模知识获取领域,能够提升信息抽取和理解的准确度。 论文作者包括李婷玉、王亚、曹聪、张再跃和曹存根,他们分别在不同的学术机构从事兼语句知识获取、自然语言处理、大规模知识获取以及基础数学和智能信息处理等相关领域的研究。这篇研究不仅是一项理论贡献,也对实际的语义分析和文本处理技术提供了实用工具。 关键词“兼语句式”、“语义分类”和“语义组合”揭示了论文的核心内容,强调了研究者在兼语句结构分析中的重点。通过中图分类号TP391.1,读者可以定位到文本处理与语言学的相关领域。文章编号和DOI则提供了查找和引用该研究的唯一标识。 本文是对兼语句式语义特征进行深入研究的成果,为兼语句的自动理解和处理提供了一种新的分类框架,有望推动文本知识获取和处理技术的发展。