基于改进BERT算法的专利知识自动抽取研究—以石墨烯为例

版权申诉
0 下载量 9 浏览量 更新于2024-04-07 收藏 442KB DOCX 举报
基于改进BERT算法的专利实体抽取研究—以石墨烯为例.docx是一篇研究专利文档中知识的先进技术和生产工艺发展情况的论文。专利文档中包含了大量进行创新性工作的作者所研究的内容,这些内容代表了技术的先进发展。然而,由于专利文档数量庞大,如果需要进行人工分析和信息提取,则工作量巨大,同时也容易受到操作者自身技术能力的限制。因此,采用自动获取技术是专利分析的重要手段。 自然语言处理在最近几年成功应用到许多文档处理相关领域,并取得显著效果。基于实体关系的知识图谱技术采用符合人类社会模型认知的方式来深入挖掘事物之间的联系,从而推动知识的演进。专利文档中说明书和权利要求是包含了大部分专利信息的核心文档,权利要求定义了专利的保护范围,而说明书则清晰地介绍了发明或实用新型的结构、技术要点、使用方法等。 本文将采用两种算法进行专利信息的抽取,以实现对专利文本中涉及物和关键工艺的认知。在专利知识抽取方面,国内学者探索了多种抽取方法,包括规则、模板、机器学习、本体等。文献[1]研究了专利摘要信息抽取的技术和步骤,采用词典、规则和统计模型方法,以解决隐含在专利文本中的信息抽取难题。 通过改进BERT算法,本文尝试提高专利实体抽取的准确性和效率。BERT算法是一种预训练语言表示模型,能够更好地理解文本语境。该算法在自然语言处理领域取得了巨大的成功,本研究将其应用于专利文档的实体抽取任务中。特别是以石墨烯为例,将专利文档中有关石墨烯的实体和关键工艺抽取出来,以便更好地理解该领域的技术发展和创新。 石墨烯作为一种新型材料,在材料科学领域有着广泛的应用前景。通过对相关专利文档的实体抽取,可以更好地了解石墨烯的制备方法、应用领域和技术特点。通过对比不同算法在石墨烯专利文档中的效果,可以评估改进BERT算法在专利实体抽取任务中的优势和局限,为专利研究提供更加准确和高效的工具和方法。 综上所述,基于改进BERT算法的专利实体抽取研究—以石墨烯为例.docx是一篇重要的研究工作,通过这项研究可以更好地理解专利文档中的知识和技术,为专利分析和研究提供更加准确和有效的方法。通过这项研究,我们可以更好地了解石墨烯领域的发展情况和技术特点,为相关领域的发展和创新提供支持和指导。