没有合适的资源?快使用搜索试试~ 我知道了~
可在www.sciencedirect.com在线获取理论计算机科学电子笔记354(2020)129-139www.elsevier.com/locate/entcs基于本体的机构知识库数据复用与扩充的协同工作描述Mar 'ıa Medina Nietoa,1 Delia Arrieta D' ıazb,2JorgedelaCallejaMoraa,3LauraZacatzontetlHern'andezc,4Marilu'ZacatelcoP'erezc,5aDepartamento dePosgradoUniversidadPolit'ecnicadePueblaJuanC.BonillaPuebla,M'exicobFacultaddeE cono m'ıa,Contadu r'ıayAdminist raci'on.Ju'arezdelEstadodeDurangoDurango,Durango,M'exicocIngenie r'ıa enInform'aticaUniversidadPoli t'ecnicadePueblaJuanC. BonillaPuebla,M'exico摘要除了辅导和咨询,大学学术和科学文件的发展证明了合作工作。 提出了一种基于本体的不同模式描述方法通过重新使用和丰富来自机构知识库和海报集的数据来实现协作。该方法使用了一个应用本体,使明确的作者和海报之间的关系。本文提出了一个列表的能力问题,回答自然语言和本体术语。所提出的方法是有价值的,因为它提供了机器可读的数据,以支持进一步的分析和推理机制。本文是对CEUR会议记录“第语言,算法,推理的新方法(LANMR 2019)保留字:本体、语义网、机构知识库、文档管理1电子邮件:mailto:maria.medina@uppuebla.edu.mx2电子邮件:mailto:darrietad@hotmail.com3电子邮件:mailto:jorge.delacalleja@uppuebla.edu.mx4电子邮件:mailto:laurita-z-h@hotmail.com5电子邮件:mailto:marilu.zacatelco@uppuebla.edu.mxhttps://doi.org/10.1016/j.entcs.2020.10.0101571-0661/© 2020作者。出版社:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。130M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)1291引言除了辅导和咨询,大学中学术和科学文献的发展是协作工作的证据,可用于支持管理决策。 目前,UniversidadPolit'ecnicade Puebla(UPPue)通过使用其机构知识库(IR)的基础设施分发开放获取的文件,如文章,硕士论文和海报,从现在开始,UPPue-IR。本文代表了CEUR会议记录的“第十二届海报是由不同学术课程的研究生撰写的文件,他们报告研究活动的部分结果;海报通常在研讨会或大会上展示。UPPue-IR是一个文档数据库,允许用户检索教师,学生或两者之间经常产生的有效文档。从技术的角度来看,这个知识库实现了开放档案倡议协议(OAI-PMH协议)[1],以与国家知识库[2]进行互操作,该协议也用于导出文档的描述性数据,通常称为元数据。该协议的实现意味着文档是通过使用都柏林核心元数据元素集作为默认元数据标准来描述的[3]。本标准中与海报作者之间的协作相关的元素是创建者和贡献者,第一个存储学生的名字,而第二个是指他/她的导师;如果有第三个或第四个作者,他们的名字也存储在贡献者元素的多个实例与搜索引擎检索的海报不同,海报或其他类型的学术文件的作者列表中的顺序既不考虑他们的贡献本文提出了一种基于本体的方法来描述海报作者之间的合作,通过重用和丰富的数据从UPPue-IR。该方法使用一个应用本体,使明确的学生,教师和海报之间的关系。本文的结构如下。第2节介绍了用户类型及其能力问题(CQ)。第3节描述了本体的主要组成部分。第4节包含CQ的答案。第5节列举了从本体导出的隐式信息。最后,我们在第6节中总结了目前的工作以及进一步的研究前景。M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)1291312用户类型及其能力问题根据[4],本体是“共享概念化的具体化”;在计算机和信息科学中,本体是对存在于特定感兴趣领域中的实体之间的类型、属性和关系的正式定义[5]。本体是由实例、概念、规则和关系组成的知识模型,对一组人或计算机具有唯一的表示。表1显示了海报收藏的主要用户类型用户类型描述顾问指导研究生的研究工作的人,研究工作在海报上被报道。顾问是作者名单中的第二位作者经理负责导出元数据的IR经理学生海报的主要作者,作者列表中的第一位老师海报的第三或第四作者,来自学术界的人,评论海报表1海报收藏的用户类型建议的本体的范围由表2的能力问题(CQ)确定,有关CQ的更多信息可以在[6]和[7]中找到。 CQ1 到CQ3支持海报的知识获取,而CQ4到CQ7具有关于作者之间的协作工作的具体信息3主要本体组件本文提出了一种本体来描述海报集作者之间的不同协作模式该集合的元数据从UPPue-IR导出并转换为本体实例。请注意,任何其他132M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129CQ数量CQ的自然语言CQ1什么是海报?CQ2海报是干什么用的?CQ3用什么样的DC元素来描述海报?CQ4谁用海报?CQ5哪些是将海报存放到UPPue-IR中的强制性元数据元素?CQ6海报是如何被引入本体的?CQ7谁构成海报的作者名单表2建议的本体的能力问题实现OAI-PMH协议的企业也有自己的机制来导出Meta数据。本体由类的层次结构、一组数据属性(数据属性公理)、对象属性(对象属性公理)和实例(也称为个体)组成,这是通过使用Prot′eg′esoftwaretoolversion来编辑的。5.2[9]。以下各节介绍这些组件。3.1主要类所提出的本体的主要类被称为大学,目的是有一个通用的概念,指的是使用所提出的本体的上下文表3示出了本体的第二级的三个类的名称和描述,其余概念通过泛化和特化获得,并且分布在类层次结构中的第三级或第四级之间。按照惯例,类名以大写字母开头。M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129133类描述部这个班级指的是学生或老师的归属海报由学生撰写的报告其研究活动用户User类集成了用户类型(顾问、经理、学生和教师)。顾问是一种老师表3建议的本体的第二层的类3.2数据属性层次结构第二层的类用数据属性描述。 例如,用户的姓名、姓氏或性别,海报的标题和日期都被建模为数据属性。与OAI-PMH协议和DC元素的实现相对应的所有互操作性方面都可以表示为数据属性,这些数据属性将海报和用户与来自XML模式数据类型或RDF文字的数据值联系起来[8]。3.3对象属性作者之间的协作工作,以产生海报在本体建模为对象属性,它们与域和范围的限制,如表4所示。表5示出了对象属性的方面,符号如下:函数(F)、逆函数(IF)、不对称(AS)和不对称(I)。表4中的对象属性、表5中的方面和本体实例形成本体的ABox,推理机使用该框来维护逻辑一致性并推断新知识。值得一提的是,任何对象属性都被考虑对称的、传递的或互反的。海报和用户类型被建模为本体实例。设计了一个半自动的过程,以将元数据从UPPue-IR转换为本体实例。作为一种说明方式,图1显示了构成海报图2显示了本体的西班牙语版本中的用户信息西班牙语术语的翻译如下:134M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129对象属性域范围分配给老师部hasTeacher部老师制作于海报部hasPoster部海报hasStudent部学生研究学生部isAdvisorOf顾问学生isFirstAuthor学生海报isSecondAuthorOf顾问海报isThirdAuthorOf老师海报isFourthAuthorOf老师海报管理者海报经理表4用于对协作工作进行建模以生成海报的对象属性Fig. 1. 按年份分列• apellidoMaterno,第二个姓• nombreDePila,name• Autor,Author,User类的子类• esAutorDe,isAuthorOf• cartel1,poster1M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129135对象属性刻面分配给F、AS、IRhasTeacherAS、IR制作于F、AS、IRhasPosterAS、IRhasStudentAS、IR研究F、AS、IRisAdvisorOfAS、IRisFirstAuthorF、AS、IRisSecondAuthorOfF、AS、IRisThirdAuthorOfF、AS、IRisFourthAuthorOfF、AS、IR管理者AS、IR表5对象属性的面• genero,gender• apellidoPaterno,姓136M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129图二、有关User类的本体实例的信息M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129137图3显示了两个不同用户的使用信息。值得注意的是,这些用户的角色包含在本体中(tieneSinodal相当于isThirdAuthorOf,而CompleorDeTiempoCompleto是用于FullTimeTeacher类的图3.第三章。关于两个用户的协作工作的信息图4显示了海报集合的本体度量请注意,公理的数量是2985,有396个本体实例(个人帐户)。图四、海报本体的构建138M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)1294能力问题CQ被用作本体评估的指南本节用自然语言和形式概念给出CQ的本体元素的使用信息的摘录被描述为正式答案。• CQ1:什么是海报?海报是研究生写的一份文件,他/她报告他/她研究活动的部分结果。正式答复:· 批注属性:Poster类的rdf:isDefinedBy· 数据类型属性:Poster类的posterData· 对象属性:wasProducedIn、isManagedBy、isFirstAuthorOf、isSecondAuthorOf、isThirdAuthorFor、isFourthAuthorOf• CQ2:海报是用来做什么的海报是报告研究活动进展或部分成果的文件正式答复:· 分类:海报· 海报SubClassOf大学· 对象属性: 制作于,有海报• CQ3:什么样的DC元素被用来描述海报?标题、日期、年份、主题(部门)和作者列表(创建者和贡献者元素)正式答复:· 分类:海报· 海报SubclassOf大学· 数据属性:标题,(功能)· 数据属性:年份,(函数)· 数据属性:主题,(函数)· Date属性:date,(函数)• CQ4:谁使用海报?UPue-IR用户类型包括顾问、经理、学生和教师正式答复:· 类别:用户· (顾问、经理、学生、教师)SubClassOf用户· 批注属性:rdf:isDefinedBy,用于Advisor、Manager、Student、Teacher• 核心问题5:哪些是将海报存入UPPUE-IR的强制性元数据必须填写的内容是标题、年份、主题和日期。正式答复:· 数据属性:标题、字符串或RDF文字· 数据属性:年份,整数· 数据属性:主题、字符串或RDF文字· 日期属性:日期,日期数据类型M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129139• CQ6:如何将海报引入本体?将海报作为实例引入到本体中,用对象属性表示作者的协作信息。正式答复:· 分类:海报· 海报SubClassOf大学· 对象属性:见表4• CQ7:谁在海报中列出作者名单?一名研究生(第一作者),一名顾问(第二作者)和两名教师(第三和第四作者)。正式答复:· 对象属性isFirstAuthorOf、isSecondAuthorOf、isThirdAuthorOf、is-FourthAuthorOf· isFirstAuthor,domain(学生)· isSecondAuthor,domain(Advisor)· isThirdAuthor,domain(教师)· isFourthAuthor,domain(教师)总之,尽管本体论在表示将语义信息添加到来自IR的特定数据集合方面是简单的,这能够使用其自己的术语来表示CQ及其答案。所有不一致之处在发布前都已纠正。Hermit和Pellet推理机用于验证逻辑一致性。本体可以导出为不同的语义Web语言,如RDF[8]或本体Web语言[10]。5从本体论本体的形式特征使得能够提取隐含知识如下:• 如果海报的第二作者是教师,则他/她被视为顾问• 如果一个学生是海报的第一作者,那么他/她是研究生• 如果一个海报只有两个作者,第一个是研究生,第二个是他/她的导师• 一个系有很多老师,但是一个老师只分配到一个系• Poster和User是不相交的类• 用户不能同时是学生和教师• 如果一个老师是一个顾问,这意味着至少他/她的名字出现在作者名单的第二位公理、基数、域和范围限制的建立以及对象属性的定义,使得知识能够形式化表示140M.A. Medina Nieto et al. /Electronic Notes in Theoretical Computer Science 354(2020)129有助于发现可能的数据不一致。例如,基数限制可以被插入到本体中,以便为每个发帖者建立最小、精确或最大数量的作者。本文所描述的本体可以根据潜在用户的兴趣6结论本文提出了一种基于本体的方法来描述协同工作,重用和丰富的数据从机构知识库。通过导出海报集合的元数据获得本体实例。该方法使用本体来形式化地表示用户和海报之间的关系本文使用了一个由本体术语回答的CQ列表用自然语言和正式的答案。自然语言的答案存储为RDF语言的定义,而正式答案则从Protg本体编辑器的使用对话框中提取。推理机使用本体信息来推断新知识以及发现可能的数据不一致,最后一个特征为来自IR的数据增加价值本体本身和它们的实例形成了一个机器可读的数据集,可以通过语义技术来开发。作为未来的工作,我们计划在本体评估过程的设计工作,以获得反馈的构建本体。引用[1] Lagoze角,Van de Sompel,H.开放档案倡议:建立低障碍互操作性框架。Proceedings of the 1stACM/IEEE-CS Joint Conference on Digital Libraries(JCDL(2001年)的第10页。电话:+86-10- 8888888传真:+86-10 - 88888888[2] 国 家 代表。Re positorioNacional. 墨西哥总 督 。国 家电信城市委员会( CON ACYT )。 检索自 :https://www.repositorionacionalcti.mx。(2019年)。[3] DCMI元数据术语。都柏林核心元数据倡议。数据来源:http://www.dublincore.org/specifications/dublin-core/dcmi-terms/。(2014年)。[4] Gruber,T. R.面向知识共享的本体论设计原则。国际人机研究,卷。43不。四比五907-928 (1995年)。[5] 治愈了 一个人。 检索自:https://www.ecured.cu/Ontolog\unhbox\voidb@x\bgroup\let\unhbox\voidb@x\setbox\@tempboxa\hbox{\OT1\i\global\mathchardef\accent@spacefactor\spacefactor}\let\begingroup\endgroup\relax\let\parkrespaces\relax\accent19\OT1\i\egroup\spacefactor\accent@spacefactor. (2019年)。[6] 诺伊,N.F.、哈夫纳角D. 本体论设计的现状:调查与比较评论。在AI Magazine.第18卷。No. 1,53-74. (1997年)。[7] Bezerra 角,Freitas ,F.,Santana ,F.用能力问题评估本体在2013年IEEE/WIC/ACM网络智能(WI)和智能代理技术(IAT)国际联合会议上,IEEE计算机协会华盛顿特区,美国。第03卷。一号。284-285. ISBN:978-0-7695-5145-6。doi:10.1109/WI-IAT.2013.199。(2013年)。[8] RDF1.1 XML语法。 检索自:http://www.w3.org/TR/rdf-syntax-grammar/。(2001年)的第10页。[9] Musen, M. A. 保护项 目 : 一个很好的背景和 一个 很 好 的 墙。 AI很重要。 ASocietyofComputingMachinery Speci fic Interest Group in Arti ficial Intelligence , Vol. 1 No. 4 , 4-12. doi :10.1145/2557001.25757003。(2015年)。[10] OWL Web本体语言概述。检索自:http://www.w3.org/TR/owl-semantics/。(2004年)。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功