预训练模型驱动的多标签专利分类研究与实践

版权申诉

9 浏览量更新于2024-07-02 收藏 413KB DOCX 举报

本研究文档聚焦于"基于预训练模型的多标签专利分类研究"这一主题，它针对当前专利文献快速增长带来的分类难题展开深入探讨。专利作为科技创新的载体，其数量庞大使得传统的手工分类和小规模机器学习方法已难以满足高效、精确的分类需求。国际上普遍采用的专利分类标准如IPC、ECLA、UPC/USPC、FI/F-term和CPC，其中IPC因其广泛适用性而备受关注，但也因类别繁多和相似性强导致分类复杂。文章强调了现有的深度学习方法在专利分类中的应用，尤其是单一主分类号的处理，但往往忽视了细粒度分类的重要性。为了克服这一问题，研究者提出构建了一个大规模的专利分类数据集，涵盖了多标签特性，利用预训练模型BERT、RoBERTa和RBT3进行模型微调。这些模型在Sigmoid激活函数和BCEWithLogitsLoss损失函数的支持下，能够有效地处理多类别专利分类任务。评估指标选用准确率和Micro-F1值，以验证预训练模型在大规模数据集上的性能。创新点主要表现在两个方面：首先，通过创建可扩展的数据集，使得模型能够适应不断增长的专利文献处理需求；其次，通过微调预训练模型，实现了对专利文献的细粒度多标签分类，突破了传统方法在分类精度和效率上的限制。这种方法有望提高专利检索和审查的效率，对推动技术创新和知识产权管理具有重要意义。整个研究旨在提升专利分类领域的技术水平，并为未来的智能专利管理系统提供技术支持。

输入降噪自编码器（>/"$)$/%+"/*"&>）进一步抽取特征获取专利

文本的低维表示最后用 1- 对专利分类。胡杰等







将词向量输入 :: 进行专

利文本表示再用随机森林算法对专利类别进行预测。

上述研究都是针对单标签专利文本的分类研究。而在多标签专利文本的分

类研究方面包翔等







结合专利文本的固有格式以及每个专利文本可以拥有多个

 分类号的情况将多示例多标签学习应用于专利自动分类中。吕璐成等







考

虑到传统机器学习方法存在的缺陷综合考虑专利文本语序特征、上下文特征和

分类关键特征设计 '"&1*@!;::、'"&1*@6  等  种深度学习模

型选取  主分类号的“部”作为分类依据实验证明深度学习模型实验效果优于

传统分类模型。 $ 等







提出一种能够应用于大型专利分类的深度学习算法

>5#/选取美国国家专利数据作为数据集用标题和摘要代表专利文本主

要信息然后使用 4$5%# 模型将文本单词转换为词向量再将词向量连接成密

集矩阵  最后将矩阵输入 :: 模型进行多标签专利文本分类。  等







在

>5#/ 的基础上提出了 !3- 数据集使用权利要求书作为专利文本

的主要内容用预训练的  ! 模型作为主要模型实验证明  ! 模型针对多标

签的专利文本有更好的分类效果。

综上所述英文专利分类已经有比较成熟的数据集和研究内容中文专利目前

缺少大规模数据集作为研究支撑且分类号精确粒度较粗。因此本文通过构建大

规模的中文专利数据集用以进行多标签专利分类任务选取  分类号的前  位

作为分类标签采用预训练模型进行训练和测试。

3 相关模型和技术

 ! 模型

 ! 模型是由谷歌团队于  年提出的预训练模型







 全称是

$&$*$"/#2  /*"&  5)/#$"/  0"  !#/)0") 即双向

!#/)0" 的文本表示模型使用了 -#)4&- 和 :;//*&$*$"/

两种方法分别捕捉词语和句子级别的语义信息。

!#/)0" 模型

 年 谷歌团队提出了 !#/)0" 模型解决 A+/*"A+/*

问题







。该模型放弃了传统 /*"&>*"& 框架与 :: 或 :: 模型相结合

的固有方式使用 /$"/ 结构并行训练模型大大减少了模型的计算量提高了

并行计算的效率在多个数据集上取得了良好的实验结果。图





为 !#/)0"

模型的结构示意图  它由左边的编码模块（ /*"& ）和右边的解码模块

（>*"&）组成。

图 

剩余14页未读，继续阅读

罗伯特之技术屋

粉丝: 4415
资源: 1万+

预训练模型驱动的多标签专利分类研究与实践

基于BiLSTM_ATT_CNN中文专利文本分类

ChatGPT技术的预训练模型构建与评估方法研究.docx

ChatGPT的预训练模型与微调模型的比较.docx

ChatGPT技术的预训练模型选择与迁移学习方法.docx

ChatGPT技术的生成语言模型和预训练模型比较.docx

ChatGPT的预训练模型选择与使用建议.docx

ChatGPT技术的预训练模型分析与选择策略.docx

5G+工业互联网专利态势研究.docx

预训练模型介绍.docx

ChatGPT技术的迭代训练和模型更新管理方法研究.docx

最新资源