专利摘要生成：基于概念图的深度学习方法

需积分: 5 41 浏览量更新于2024-07-09 收藏 274KB PDF 举报

"该研究论文探讨了一种利用概念图（Conceptual Graphs, CG）进行专利文献摘要的新方法。通过自动识别文档中的概念及其关系，生成专利文件权利要求部分的抽象摘要。研究中，作者使用Sowa提出的CG形式来表示概念和它们之间的联系，并着重分析了专利文件的权利要求部分，因为这部分同时具有技术和法律的复杂性。由于通用的深度解析器无法有效地处理专利文件的特定语言结构，研究者采用了浅层解析、命名实体识别（NER）和机器学习技术来提取概念和概念关系。特别是，他们应用了受限玻尔兹曼机（Restricted Boltzmann Machines, RBM），一种深度学习技术，来自动提取CG。在电子领域的5000份专利文件语料库上测试了这种方法，结果表现出色，能与最先进的系统相媲美。" 在专利文献摘要中，概念挖掘（Concept Mining）是关键步骤，它涉及从文本中识别和提取关键概念，这对于理解专利的创新点至关重要。CG是一种图形表示法，能够清晰地表示出概念间的语义关系，对于专利摘要的生成，它提供了结构化的框架。在专利文件的权利要求部分，信息密集且语言复杂，因此需要专门的方法来处理。通过浅层解析，可以提取出句子的基本结构，而命名实体识别则用于找出具有特定意义的术语或实体。机器学习技术进一步增强了这种识别能力，能够根据训练数据自我学习和改进。受限玻尔兹曼机（RBM）是深度学习的一种模型，擅长从大量数据中学习模式并进行特征提取。在本研究中，RBM被用来自动构建CG，从而帮助生成占整个权利要求部分30%的摘要。这种方法的优势在于它能够捕获到文本的深层次结构，生成的摘要既能保留原文件的核心信息，又保持了简洁性。实验结果表明，该方法在处理专利文献时具有很高的效果，这为专利检索、分析和管理提供了一种高效工具。通过使用特定领域的大量专利文件进行训练和验证，该方法的性能得到了充分的验证，证明了其在专利文档摘要中的实用性。总结来说，这篇研究论文提出了一个综合运用概念图、浅层解析、命名实体识别、机器学习和深度学习（RBM）的专利摘要生成框架，有效解决了专利文献复杂性和专业性的挑战，为专利信息处理提供了新的思路和解决方案。

weixin_38678498

粉丝: 3
资源: 915

专利摘要生成：基于概念图的深度学习方法

文献检索-特种文+循证医学+引文数据库检索.ppt

文献信息检索与论文写作考试题.pdf

ASP外观专利图像检索平台(源代码+论文).rar

化学文献检索讲义－绪论.doc

文献检索与论文写作教学大纲.doc

北京市专利现状、问题及对策研究

知识元驱动的外文专利文献智能描述框架

"特种文献信息检索与分析：会议、学位论文、专利、标准、科技报告

"文献检索与科技论文：中文数据库的构建与应用

毕业论文文献检索策略与高效工具

最新资源