专利摘要生成:基于概念图的深度学习方法
需积分: 5 41 浏览量
更新于2024-07-09
收藏 274KB PDF 举报
"该研究论文探讨了一种利用概念图(Conceptual Graphs, CG)进行专利文献摘要的新方法。通过自动识别文档中的概念及其关系,生成专利文件权利要求部分的抽象摘要。研究中,作者使用Sowa提出的CG形式来表示概念和它们之间的联系,并着重分析了专利文件的权利要求部分,因为这部分同时具有技术和法律的复杂性。由于通用的深度解析器无法有效地处理专利文件的特定语言结构,研究者采用了浅层解析、命名实体识别(NER)和机器学习技术来提取概念和概念关系。特别是,他们应用了受限玻尔兹曼机(Restricted Boltzmann Machines, RBM),一种深度学习技术,来自动提取CG。在电子领域的5000份专利文件语料库上测试了这种方法,结果表现出色,能与最先进的系统相媲美。"
在专利文献摘要中,概念挖掘(Concept Mining)是关键步骤,它涉及从文本中识别和提取关键概念,这对于理解专利的创新点至关重要。CG是一种图形表示法,能够清晰地表示出概念间的语义关系,对于专利摘要的生成,它提供了结构化的框架。在专利文件的权利要求部分,信息密集且语言复杂,因此需要专门的方法来处理。通过浅层解析,可以提取出句子的基本结构,而命名实体识别则用于找出具有特定意义的术语或实体。机器学习技术进一步增强了这种识别能力,能够根据训练数据自我学习和改进。
受限玻尔兹曼机(RBM)是深度学习的一种模型,擅长从大量数据中学习模式并进行特征提取。在本研究中,RBM被用来自动构建CG,从而帮助生成占整个权利要求部分30%的摘要。这种方法的优势在于它能够捕获到文本的深层次结构,生成的摘要既能保留原文件的核心信息,又保持了简洁性。
实验结果表明,该方法在处理专利文献时具有很高的效果,这为专利检索、分析和管理提供了一种高效工具。通过使用特定领域的大量专利文件进行训练和验证,该方法的性能得到了充分的验证,证明了其在专利文档摘要中的实用性。
总结来说,这篇研究论文提出了一个综合运用概念图、浅层解析、命名实体识别、机器学习和深度学习(RBM)的专利摘要生成框架,有效解决了专利文献复杂性和专业性的挑战,为专利信息处理提供了新的思路和解决方案。
2022-10-19 上传
2021-12-01 上传
2023-10-24 上传
2021-09-29 上传
2021-09-20 上传
2020-02-05 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38678498
- 粉丝: 3
- 资源: 915
最新资源
- BottleJS快速入门:演示JavaScript依赖注入优势
- vConsole插件使用教程:输出与复制日志文件
- Node.js v12.7.0版本发布 - 适合高性能Web服务器与网络应用
- Android中实现图片的双指和双击缩放功能
- Anum Pinki英语至乌尔都语开源词典:23000词汇会话
- 三菱电机SLIMDIP智能功率模块在变频洗衣机的应用分析
- 用JavaScript实现的剪刀石头布游戏指南
- Node.js v12.22.1版发布 - 跨平台JavaScript环境新选择
- Infix修复发布:探索新的中缀处理方式
- 罕见疾病酶替代疗法药物非临床研究指导原则报告
- Node.js v10.20.0 版本发布,性能卓越的服务器端JavaScript
- hap-java-client:Java实现的HAP客户端库解析
- Shreyas Satish的GitHub博客自动化静态站点技术解析
- vtomole个人博客网站建设与维护经验分享
- MEAN.JS全栈解决方案:打造MongoDB、Express、AngularJS和Node.js应用
- 东南大学网络空间安全学院复试代码解析