没有合适的资源?快使用搜索试试~ 我知道了~
⃝可在www.sciencedirect.com上在线获取ScienceDirectICTExpress 6(2020)57www.elsevier.com/locate/icte专利关键词分析的技术认知诊断模型Sangsung Park,SunghaeJun韩国清州大学大数据与统计系接收日期:2019年7月4日;接受日期:2019年在线预订2019年摘要专利分析已经在技术管理的各个领域进行,以了解技术,如研究和开发计划,新产品开发,技术创新,可持续技术等。在专利分析中,带有技术信息的专利关键字分析非常流行,并且很有意义。为此,本文研究了一种专利关键词分析方法,并利用认知诊断模型(CDM)构建了该方法。我们称这种方法为技术认知诊断模型(TCDM),这为利用TCDM的专利关键词分析结果理解目标技术提供了重要的技术结构。我们使用人工智能(AI)技术相关的专利文献,通过实验说明了TCDM的性能。这些实验的最终目标是找到人工智能核心技术之间的关系c2020年韩国通信与信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:专利分析;专利文献;认知诊断模型;技术认知诊断模型;专利关键词分析1. 介绍认知诊断模型(CDMs)已被用于在不同的领域,如教育成就的诊断结论[1]。这是为了测试学生在给定技能方面的成就[2]。换句话说,清洁发展机制评估是否 一个学生掌握了一种特殊的技能与项目。我们首先定义了代表学生能力的技能。接下来我们需要制作物品和技能的Q矩阵。需要掌握的技能项目[3]。在使用Q矩阵的CDM中,我们可以将学生分为二进制技能类,即1或0.如果二进制值等于1,那么学生掌握了技能。否则,学生不会。最后,CDM的参数估计本文将教育领域的CDM应用于技术领域的专利分析。我们称之为技术认知诊断模型(technological cognitive diagnosis model,TCDM)。专利分析是技术管理的重要工作之一。这是因为公司和研究机构可以计划∗ 通讯作者。电子邮件地址:hanyul@cju.ac.kr(S.公园),shjun@cju.ac.kr(S。Jun)。同行评审由韩国通信和信息科学研究所(KICS)负责https://doi.org/10.1016/j.icte.2019.09.004并利用专利分析的结果进行研究和开发(R D)[6]。一项专利包含开发技术的各种新颖信息,如标题、摘要、权利要求、国际专利分类(IPC)代码、发明人因此,许多与专利分析相关的研究在不同的领域展开。因此,我们提出了一种新的方法(TCDM)的专利分析的基础上CDM。在TCDM中,CDM的学生和项目分别是专利和关键词,而技能是核心技术关键词。学生掌握一项特定技能意味着专利文件包含一个特定的关键字。为了说明如何将该研究应用于实际领域,我们使用与人工智能(AI)技术相关的专利文献进行了实验。本文其余部分的组织结构如下。第二部分介绍了专利关键词分析的研究背景。在第3节中,我们解释了被称为TCDM的拟议模型。此外,我们提供了实验结果来验证我们的研究在第4节的性能。2. 专利关键词分析在技术管理的各个领域中,他们分析了标题,2405-9595/2020韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。58S. Park和S.Jun/ICT Express 6(2020)57()=|∏=-=()==|×n(∑==-=×∑∏[]=i i1i2ip[客户端]i=1摘要、IPC代码、引文、权利要求等。技术预测、技术创新、新产品开发、可持续技术等[8专利关键词分析是专利分析的多种方法之这主要使用从检索到的与目标技术相关的专利文件中提取的关键词,并应用基于统计和机器学习算法的分析模型[9,10]。专利关键词包含给定技术领域的技术方面因此,通过对专利关键词的分析,可以得到技术分析的结果本文研究了一种专利关键词分析方法。3. 技术认知诊断模型在本文中,我们提出了TCDM作为一个CDM的技术分析。我们认为第i个专利响应于第j个关键字,其中i和j是i=1,2,.. . n和j=1,2,. . .,mE步骤中每个关键字和关键字组的预期计数。然后,在M步中,我们使用MMLE更新DINA的参数估计。我们重复E和M步骤,直到满足收敛准则或最大迭代次数的条件。PT ij1 α i是专利i包含关键词j的概率,给定专利i的技术基于核心关键词j(αi)。在我们的研究中,我们假设专利i的Xi和关键词是独立于αi的条件。TCDM将u [u,v]定义为具有u [u1,u2,.. . .,um]和v [v1,v2,. . . [13],[14],MP(T i|α k,α k)=N Ti j(1 −N)1−Ti jj=1其中N P Tij1αk,uj,vj,我们使用以下对数似然估计TCDM中DINA的参数分别对m个关键词的所有n个专利响应具有由Tij表示的二进制值。每个Tij都有二进制值,n m矩阵T由所有Tij组成.在这个矩阵中,第i行是logL(π,π)=∑i=1日志pk=1P(T i|α k,α k)P(α k|π))专利i对所有m个关键词的响应。我们决定p个核心关键字dk(k1,2,. . .,p),并且p小于或等于m。我们发现专利i对核心关键词k的反应。如果专利是我们使用EM算法最大化关于π和π的对数似然。EM算法的E步是基于贝叶斯规则从个体后验包含关键字k,则dik的值为1(dik1),否则为dik0。因此,dik1意味着专利i具有与关键字k相关的技术。一般来说,我们可以P(α k|Ti)=P(T i|α k)P(α k|π)P(Ti)不知道dik的值,所以我们使用TCDM估计值。在专利专家[12]的帮助下,我们为TCDM建立了一个mp矩阵Q。Q的qjk具有0或1值。如果关键字j与核心k相关,则qjk=1,否则qjk=0。在建议的TCDM中,我们使用两个模型,DINA(确定性输入噪声或门)和G-DINA(广义确定性输入噪声或门)。DINA是受欢迎的根据贝叶斯nS jk=P(α k|T i,)i=1然后,第二计数也计算如下。∑清洁发展机制的模式[1,4,5]。所以我们把这个模型应用到TCDM。在TCDM中,我们假设所有专利都具有基于核心关键字的技术,因为专利是通过目标技术的关键字方程检索的。这符合DINA的不予赔偿要求。第i个专利包含第j个关键字的概率由确定性和概率性组成。在确定性的情况下,具有核心技术的专利具有基于关键字j的技术。此外,确定性分量定义如下。pbi j=α ikqjkk=1专利i包含核心关键词αα,α,. . .,α关键字j此外,q j1,q j2,. . .是Q矩阵的第q行。该矩阵指示包含专利j所需的核心关键字。如果bij的值等于1,则具有全部或甚至多于所需核心关键字的第i个专利具有关键字j。否则,专利i不包含关键字j。为了估计DINA模型的参数,我们使用边际最大似然估计(MMLE)和EM算法由E步和M步组成我们计算利用E步的结果,我们得到了核心专利αk中的专利。接下来我们最大化在M步中重复期望值。当参数的增量足够小时,EM方法的迭代结束。因此图 1显示了拟议的TCDM过程。在确定目标技术后,利用关键词方程从专利数据库中检索与目标领域相关的专利文献。在本文中,我们使用数据库作为专利数据库之一的WIPS公司(WIPSON) 在世界[15]。为了分析所收集的专利文献TCDM,我们转换成专利关键字矩阵(结构化数据),使用文本挖掘技术的文件。该矩阵的列和行分别为技术关键词和专利。对于我们的TCDM,我们从专利关键字矩阵构建Q矩阵,并定义Q矩阵中使用的核心关键字。利用MMLE和EM算法,我们得到了我们的DINA模型用于专利数据分析。在下一节中,我们使用与AI技术相关的专利文件展示了我们研究的有效性和性能。本文利用AIC(赤池信息准则)和BIC(贝叶斯信息准则)对DINA模型进行了评价。AIC的定义如下[13]。AIC= −2logP(x|(θθ)+2 knRjk=T ijP(α k|Ti,)S. Park和S.Jun/ICT Express 6(2020)5759()下一页==-表1提取了AI技术的关键词。号关键字编号关键字Fig. 1. TCDM过程。1分析202认识213行为224认知235协作246计算机257对话268语料库279对话2810反馈意见2911图3012图像3113推论3214接口3315语言3416学习3517心灵3618形态学3719自然38网络神经对象本体模式识别表征句子情感情境空间语音理解视频视觉语音人工数据智能其中x是观测数据,θ是MLE(最大似然估计)。k也是拟合参数的数量。BIC也表示如下[13]。BIC = − 2logP x|θ+ klog(n)其中n是数据大小。AIC和BIC的值越小,模型的性能越好4. 实验结果表2图二. 参数概率。在本文中,我们使用从WIPSON中提取的专利文件来说明我们的研究如何应用于实际领域[15]。这些文件与人工智能技术有关,并于2016年注册对文献进行预处理后,共获得13,858项专利,并在表1中选择了38个关键词。在检索专利文献的预处理过程10大概率值的技术关键词排名无关键字概率思考,行动。这些都是作为传统的技能9CDM。使用称为CDM的R包,我们得到10的结果我们的DINA模型[1]。该模型的评估如下:AIC22物体37数据0.8630.742111 416.2,BIC112 222.6,和RMSEA0.012,其中RMSEA表示近似均方根误差。图 2表示参数的概率值。在图2中,我们在表2中找到了概率值较大的技术关键词。我们可以看到,AI技术就是基于这十大技术关键词。从表1的结果中,我们已经提取了人工智能技术的核心关键词(感知,学习,表现,思考,行动)。也就是说,这五个关键词为AI提供了五个子核心技术.然后,图3显示了每个核心关键字的技能掌握概率我们知道感知的概率是最大的。接下来是行动,表现,思考,学习。因此,我们发现基于感知的技术是AI技术中最重要的。表3显示了AI技术的子技术的技能排名为了确认具体技术之间的特定关系,我们使用子技术进行相关性分析。表4显示了核心关键词之间相关系数的绝对值。基于感知的技术比其他技术更适合于基于学习的技术。此外该本文采用R数据语言及其文本挖掘包,620网络0.892年龄[16在这些关键词中,我们定义了5个核心技术-731讲话0.872nological关键词如下; sensing感测,learning学习,representing代表,833视频0.870138情报0.999225识别0.985315语言0.97641分析0.975524图案0.94660S. Park和S.Jun/ICT Express 6(2020)57图三. 技能掌握概率。表3子技术的技能排名技能排名子技术表4相关系数的绝对值。关键字感测学习代表思维代理感测1.000.160.100.030.02学习0.161.000.840.290.23代表0.100.841.000.210.16思维0.030.290.211.000.79代理0.020.230.160.791.00第一第二第三第四第五基于感知的技术基于行动的技术基于表现的技术基于思考的技术基于学习的技术见图4。 AI技术图。本文提出的技术分析模型是将现有的教育领域的技术分析模型应用于技术分析这一完全不同的领域。此外,我们还证明了在所有子技术中,学习技术和表现技术之间的关系最大。使用表4的结果,我们构建了图4中的AI技术图。 四、图4、我们发现人工智能的技术分为两个子技术(I和II)。技术I可以被定义为制造AI系统的技术,包括传感器数据收集,分析或学习收集的数据,并表示数据分析的结果技术二是人工智能技术的使用,如人工智能行为和思维机器。5. 结论我们提出了一个TCDM技术分析。同时,我们将传统的CDM方法应用于专利关键词分析,本文称之为TCDM。本文选择人工智能技术作为专利关键词分析的目标领域。我们从WIPSON的专利数据库中检索了与AI技术相关的专利文献利用基于R语言的文本挖掘技术及其软件包,构建了专利关键词矩阵,作为TCDM专利关键词分析的结构化数据。该矩阵的行和列维度分别为13,858和38也就是说,该矩阵有13,858项专利和38个关键词。相反针对现有CDM中的学生和项目,分别使用专利和技术关键词。我们还从专利关键词矩阵中提取了核心关键词,以取代传统CDM中的技能成分。提取的核心关键词是感知、学习、表征、思考和行动。从TCDM的结果中,我们发现学习与感知和表示有关,并使用这三个关键词,我们定义了技术I,即制造AI系统的技术。接下来,我们使用关键词思考和行动来定义技术II,该技术意味着有效地使用AI系统的技术。我们提出的TCDM使用与AI技术相关的专利文件。为了提高我们提出的专利关键词分析模型的性能,我们将TCDM和认知计算与大数据分析相结合。竞合利益作者声明,本文中不存在利益冲突。引用[1] A.C.乔治,A. Robitzsch,T. Kiefer,J. Groovy,A.Ünlü,用于认知诊断模型的R包CDM,J. Stat.软件。74(2)(2016)1-24。[2] A.A. Rupp,J. Templin,R. A. Henson,诊断测量:理论,方法和应用,Guilford出版社,纽约,2010年。[3] K.K.Tatsuoka , Rulespace : Anapproachfordealingwithmisconceptions based on item response theory,J. Educ. Meas. 20(1983)345-354。[4] E.H.张文,应用限制性潜在类别模型映射成就项目的技能结构。教育Meas. 26(1989)301[5] B.W. Junker,K. Sijtsma,认知评估模型与一些假设,并与非参数项目反应理论的连接,应用。心理学。Meas. 25(2001)258[6] A.T.放大图片作者:A. L. Mason,F.A. 罗西尼,J. Banks , Forecasting and Management of Technology , JohnWiley&Sons,Hoboken,NJ,2011。[7] D.亨特湖阮,M。Rodgers,Patent Searching Tools&Techniques,Wiley,Hoboken,NJ,2007.[8] S. Jun , J. Lee , J.B. 柳 , S. Park , A novel method of IP R& Dusingpatent analysis and expert survey , Queen Mary J. Intellect. 5(4)(2015)474-494.[9] J.M. Kim , D. M. 肠 , S 。 Jun , Factor Analysis and StructuralEquationModelforPatentAnalysis : CaseStudyofAppleTechnology,Technol. Anal. 我的天管理。29(7)(2017)717[10] S.帕克,S。李,S。Jun,专利大数据分析中的模糊学习,Int. J. 模糊系统19(4)(2017)1158S. Park和S.Jun/ICT Express 6(2020)5761[11] D.嗯,J. Ryu,S. Jun,专利关键字数据的区间估计方法用于可持续技术预测,可持续性9(11)(2017)2025。[12] KISTA ,韩国 知识产权战 略局,www.kista.or.kr,( 1.01.19访问),2019年。[13] A. Gelman,J.B.卡林,H.S. Stern,D.B. Dunson,A. Vehtari,D.B.Rubin , Bayesian Data Analysis , 第 三 版 , Chapman& Hall/CRCPress,Boca Raton,FL,2013.[14] M.S. Johnson,项目反应模型的边际最大似然估计,R,J。Stat. 软件。20(10)(2007)1[15] WIPSON,WIPS Corporation,http://www. 我的意思是,com,http://global. 我们的合作伙伴com,(1.12.18访问),2019年。[16] I. Feinerer ,K. Hornik,D. Meyer,R,J. Stat. 软件。25(5)(2008)1[17] I. Feinerer ,K. Hornik,Package 'tm' Ver. 0.7-4,文本挖掘包,CRAN of R项目,2019。[18] R开发核心团队,R:统计计算的语言和环境,R统计计算基金会,维也纳,奥地利。ISBN 3-900051-07-0,2019年。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功