中文专利开放实体关系抽取:基于马尔可夫逻辑网的组块层次方法
177 浏览量
更新于2024-08-27
1
收藏 120KB PDF 举报
本文主要探讨了面向中文专利的开放式实体关系抽取(Open Entity Relation Extraction, OER)这一前沿领域。传统实体关系抽取方法通常依赖于预先定义的关系类型和规则,这对于处理大规模文本数据并不适用。然而,随着开放式信息抽取技术的发展,尤其是在英文文献中的广泛应用,该研究着重于解决中文专利文本中实体关系抽取的问题。
研究者以马尔可夫逻辑网(Markov Logic Net, MLN)为核心,结合组块层次标注(Block-based Annotation)策略来进行开放式实体关系抽取。这种方法的优势在于,通过将句子分解为可管理的组块,降低了对句子理解的复杂性,使得外层和内层组块能够被统一处理,从而减少了人工规则制定的工作量。这种方法避免了对每个关系类型的单独设计,具有更好的扩展性和适应性。
实验结果显示,在相同的特征条件下,基于马尔可夫逻辑网的关系抽取相较于支持向量机(Support Vector Machine, SVM)表现更为出色。特别是对于外层和内层组块的识别,使用MLN能够分别达到77.92%和69.20%的F值,这显示出其在抽取实体关系上的高效性能。
该研究还得到了国家“十二五”科技支撑计划项目(No.2012BAH14F00)和国家自然科学基金项目(No.61073123)的支持,证明了其理论价值和实际应用前景。研究团队由赵奇猛、王裴岩、冯好国和蔡东风四位专家组成,他们分别在自然语言处理、语义分析和人工智能等领域有着深厚的学术背景和实践经验,他们的合作为中文专利领域的开放式实体关系抽取提供了有力的技术支持。
这篇论文旨在填补中文专利开放式实体关系抽取研究的空白,通过马尔可夫逻辑网的运用,提升中文大规模文本数据的处理能力,为后续的专利信息检索、知识图谱构建等应用场景提供有效工具。未来,随着自然语言处理技术的进一步发展,这一成果有望推动中文信息抽取技术的整体进步。
2020-02-11 上传
2022-12-16 上传
2021-03-27 上传
点击了解资源详情
2021-08-19 上传
2018-10-19 上传
点击了解资源详情
点击了解资源详情
weixin_38638647
- 粉丝: 7
- 资源: 993
最新资源
- MATLAB新功能:Multi-frame ViewRGB制作彩色图阴影
- XKCD Substitutions 3-crx插件:创新的网页文字替换工具
- Python实现8位等离子效果开源项目plasma.py解读
- 维护商店移动应用:基于PhoneGap的移动API应用
- Laravel-Admin的Redis Manager扩展使用教程
- Jekyll代理主题使用指南及文件结构解析
- cPanel中PHP多版本插件的安装与配置指南
- 深入探讨React和Typescript在Alias kopio游戏中的应用
- node.js OSC服务器实现:Gibber消息转换技术解析
- 体验最新升级版的mdbootstrap pro 6.1.0组件库
- 超市盘点过机系统实现与delphi应用
- Boogle: 探索 Python 编程的 Boggle 仿制品
- C++实现的Physics2D简易2D物理模拟
- 傅里叶级数在分数阶微分积分计算中的应用与实现
- Windows Phone与PhoneGap应用隔离存储文件访问方法
- iso8601-interval-recurrence:掌握ISO8601日期范围与重复间隔检查