没有合适的资源?快使用搜索试试~ 我知道了~
基于本体的生命科学文本资源组织及其应用:生物医学本体和框架
生命科学中的人工智能3(2023)100059研究文章基于本体的生命科学文本资源组织Giulia Panzarellaa,a,Pierangelo Veltrib,Stefano Alcaroa,c,daDipartimento di Scienze della Salute,Università“Magna Græcia”of Catanzaro,CampusUniversitario“S. VenutabDipartimento di Medicina Clinica e Sperimentale,University Magna Græcia of Catanzaro,Catanzaro,88100,ItalycNet4Science Academic Spino,卡坦扎罗“ Ma g n a Gr æ ci a ” 大学,Ca m p u s Un iv e r s i ta r io “ S. VenutadAssociazione CRISEA-Centro di Ricerca e Servizi Avanzati peraRT i cL e i nf o关键词:信息过载本体语义网生命科学术语a b sTR a cT本体用于支持对覆盖域相关信息的大量数据库的访问。异质性和不同的语义可以通过使用分层概念定义中的结构化文本和描述来访问。我们对生命科学(LS)相关本体感兴趣,包括分子生物学,生物信息学,物理学,化学,医学和其他相关领域的组件。本体包括:(i)术语连接,(ii)核心概念的识别,(iii)数据管理,(iv)知识分类- 收集关键信息。本体在导航LS术语时可能非常有用。本文探讨了一些可用的生物医学本体和框架。它描述了最常见的本体开发环境(ODE):Protégé,Topbraid Composer,Ontostudio,Fluent Editor,VocBench,Swoop和Obo-edit,用于从LS计划的文本科学资源创建本体。它还比较了本体论方法的可用性,可扩展性,稳定性,集成,文档和独创性。1. 介绍生命科学中越来越多地采用本体论来增强知识的理解和可转移性[1研究小组对开发本体感兴趣[8],以将数据排列和连接到可搜索的库中[9,10],建立基本概念的框架(例如,OWS框架[11]),共享信息,使用知识以最大限度地减少混乱[12],并在生物医学研究、化学、医学、基因组学、生物学和药理学中分配不断增长的数量和数据多样性[13]。 欣赏其实用性的进一步原因是对标准化词汇表和编码语义在各个领域[8]以及建筑工具的开发或推广。为了能够广泛访问[14]并使用户能够发布、探索、创建和更新,已经发布了一些关于程序[15在过去的几年里,本体的最新技术以及半自动和自动本体生成的方法和挑战已经被各种文章[19到目前为止,关于这一主题的出版物还没有提出一个 生物医学本体和开源生物信息学数据库的列表,还考虑了对其调查和比较所需的本体开发工具(ODE)的概述。在本文中,我们调查了生命科学领域的本体论景观针对上述命题。这样的本体由科学家创建和维护,以支持他们的数据的检索、集成和分析。与本体开发、映射和维护有关的问题是必须理解和解决的关键领域[24]。要辩护的论点是,生命科学本体- GIES在这里被广泛探索,为科学研究提供了无与伦比的支持,科学家可以简单直观地创建或集成本体。在本文中,我们一直在研究和分享用于实现和构建本体的有效工具。我们讨论了从文本科学资源中使用本体开发(ODE),例 如 Protégé[25] , Topbraid Composer[26] , Ontostudio[27] , FluentEdi- tor[28],VocBench[29],Swoop[30]和Obo-edit[31]。我们首先列出一些可用的开源生物医学本体(表1)和生物信息学数据库(表2)。2. 生物医学本体和数据库本体论是一个多学科的领域,自然语言处理,信息组织和提取,人工智能,知识获取和表示[19]。 常用的本体定义来自Gruber[32]其中作为一种通用的概念化,本体学可以降低数据识别的成本,提高数据识别的灵活性,∗ 通讯作者。电子邮件地址:giulia. unicz.it(G. Panzarella)。https://doi.org/10.1016/j.ailsci.2023.100059接收日期:2022年11月12日;接收日期:2023年1月26日;接受日期:2023年1月26日2023年1月27日在线提供2667-3185/© 2023作者。出版社:Elsevier B.V.这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)可在ScienceDirect上获得目录列表生命科学期刊首页:www.elsevier.com/locate/ailsciG. Panzarella、P.Veltri和S. 阿尔卡罗生命科学中的人工智能3(2023)1000592表1特定本体的总结。本体简短描述乌贝隆[48]开放的生物医学和集成的跨物种本体,由超过6,500个代表各种解剖实体的类组成,允许集成模型生物和人类数据。细胞本体[69]动物细胞类型的本体论,而不是特定的生物体。OMP[60]在所有微生物中观察到的表型本体:细菌、古细菌、原生生物、真菌和病毒。ChEBI[70]免费提供的分子实体词典,专注于它包括一个本体论的分类。EFO[71]实验因子本体论。它是Open Targets的核心本体[72]。本体将引用中的类集合在一起例如疾病、细胞系、细胞类型和解剖结构的本体,并根据需要添加公理化,以将疾病等领域与表型联系起来。帕托[61]表型质量的本体论,主要与其他本体论(如GO或解剖学本体论)结合使用,以指代表型。例如,在一个示例中,它被人类表型本体论(HPO)用于促进跨物种整合的表型的逻辑定义。[33]第三十三话世界FlyBase[62]果蝇基因与基因组数据库它使用基因本体(GO)控制的词汇(CV)术语来表示细胞成分,生物学过程和分子功能来描述基因产物的性质。WormBase[63]数据库包括了C.的遗传学、基因组学和生物学线虫和相关的线虫。美国中央情报局[73]玻璃海鞘的解剖与发育本体学普拉纳[74]从亚细胞到系统水平的定义Schmidtea meditaliphea(Smed)解剖学术语的EX tendable关系框架在生命周期的各个阶段。[55]第五十五话它是一个参考术语,广泛覆盖癌症领域,包括癌症相关疾病、发现和异常。SNOMED CT[56]系统化的医学名词-临床术语。它是一个全面的医学术语本体,用于标准化电子健康数据的存储、检索和交换ORDO[75]孤儿罕见疾病的结构化词汇表捕捉关系和基因。[76]第七十六话融合多种疾病资源的半自动本体它旨在协调世界各地的疾病定义AEO[77]解剖实体的本体论,扩展了CARO,通用解剖参考本体论,便于组织的注释,共享共同特征,并实现跨解剖本体的互操作性。[第78话]化学功能本体描述了超过341.000生物重要化学品的功能和作用表2生物信息学数据库摘要。生物信息学数据库简短描述[53]第53话Ontology服务OBO图书馆[79]开放生物学和生物医学本体论OMIM[57]关于人类基因和遗传疾病的文献信息公共数据库。[第80话]生物医学本体AberOWL[81]本体库、语义搜索引擎OntoBee[82]一个链接的本体数据服务器,支持本体术语的解引用、链接、查询和集成[84]第85话:你是谁?基于网络的遗传和医学信息[87]第八十七话:我的世界人类疾病综合纲要及其注释基因卡[88]人类基因数据库疾病[89]疾病-基因关联的文本挖掘与数据集成[第90话]SIGNALING NETWORK生物实体KEGG[91]京都基因和基因组百科全书用于系统分析基因功能的知识库,连接基因组信息薄荷[92]用于浏览集成蛋白质相互作用网络的[93]第二十三话专门用于哺乳动物翻译后修饰(PTM)的知识库PhosphoELM[94]磷酸化位点数据库UniProtKB[95]通用蛋白质资源HGMD[96]人类基因突变数据库CTD[97]比较Xicological研究资源PedAM[98]儿科疾病注释和医学分类。特别是,当本体提供了一个共享的框架,可以在人与应用系统之间交流特定领域的共同理解时,它可以对生物医学和生物信息学等领域产生重大影响,这些领域处理大量分布式和异构的基于计算机的信息。在本节中,我们介绍了生物医学领域的前本体(表1)和知识数据库(表2)的描述性列表。使用本体作为数据库实体组织、管理、理解和表示的自动推理机制,已被证明在生物医学领域是有利的。基因本体论(GO)是目前可获得的关于基因和基因产物(蛋白质和非编码RNA)功能的可计算知识的最广泛的知识库。它为细胞成分、生物过程和分子功能(CC)提供子本体在GO-CAM的帮助下[34 -36],用户可以链接GO注释[37],例如分子功能的单词,并使用生物学背景增强它们(图11)。①的人。对于许多物种,通过各种数据源提供GO注释,包括GOA[38],Swiss-Prot[39],Ensembl[40],MGD[41]或AgBase[42]。GOChase[43]通过Gene Ontology纠正基因产物注释中的错误GoPubMed应用程序[44]还使用GO对PubMed中的数百万篇文章进行分类[45]。它使生物学领域专家能够阅读、搜索和更新与解剖学、健康、生物化学或表型有关的开放生物医学本体(OBO)[46],包括细胞本体[47]和越来越多的物种特异性解剖学本体,如Uberon [48,49]。Uberon包括一系列现有和新兴研究生物体的解剖学领域的术语,允许进行比较性进化研究。在线本体工具,如AmiGO[36]和QuickGO[50]可以额外查询基因本体。生物现实本体框架(OBR)使用SNAP和SPAN本体[51],也为增强和集成生物医学本体的方法提出了建议。Drug Ontology是可搜索的大约277个生命科学本体中的一个示例G. Panzarella、P.Veltri和S. 阿尔卡罗生命科学中的人工智能3(2023)1000593图1.一、 基因本体因果活动模型(GO-CAM)。线虫对革兰氏阴性菌的防御反应[34]第34话。并使用EBI本体查询服务(OLS)[52,53]在线门户进行浏览。在表1中,我们报告了一些OLS本体[54],物种特异性和生物医学本体,如NCI词库[55],SNOMED CT[56]或OMIM[57],可以考虑用于解决临床和疾病相关数据。例如,caBIG项目[58]使用NCI同义词库来定义在网格环境中交换项目的元数据[59]。在用于研究应用的物种特定本体中,我们提到了微生物表型本体(OMP)[60]、表型质量本体(PATO)[61]、FlyBase[62]和WormBase[63]。在这方面,TextbookCentral[64]是一个在线文献搜索平台,涵盖了关于模式生物的特定研究论文,如WormBase C。[63]第63话为一个研究有机体建立一个本体论似乎是一项艰巨的任务,但它是对社区的必要投资数据根据公平、可查找、可访问、可互操作和可复制的原则获取和处理。FAIR[65]诞生于改进支持学术数据重用的基础设施的需要所有的研究都可以更容易地访问数据,遵守公平的做法。解剖学本体可通过本体检索服务(OLS)[53]查找和访问。当使用在关系本体中找到的关系时,本体是可互操作的[49,66],并且当按照报告本体的最小信息(MIRO)实践报告时,本体是可再现的[67]。表1显示了一些物种特定本体的总结,例如,[68]第68话表2显示了生物信息学数据库的总结。2.1. 语义web技术到20世纪70年代中期,人工智能研究人员专注于开发有效的策略,用于获取,表示和推理大量领域知识[99],克服在这方面,新的研究路线指定了可重用的模型,即本体和推理组件,即,解决问题的过程[101,102],这对当代语义网技术产生了影响语义网代表了一种技术基础结构,它能够实现大规模数据互操作、发现本体与手头的任务和语义特征信息的重用相关[99]。本体在实现基于内容的访问和标准化概念的可重用性、描述语义Web实体、关系和事物类别方面起着至关重要的作用。术语“语义网”是指链接数据的网,例如,日期、标题、部件号、化学性质,通过RDF、GRIDOM、SPARQL、OWL和SKOS等技术实现。人们可以在Web、构建词汇表以及编写处理数据的规则。近年来,语义网获得了巨大的发展势头,被广泛应用于许多领域,如医学,医疗保健,金融,地质[99,103,104]。应用适当的本体论被认为是获得实体或术语的含义的正确意义、避免歧义和任何在概念上持续存在的偏差的必要条件。通过帮助临床研究中的决策,语义网技术还可以连接多种形式的生物和医学信息,允许跨机构,行业和研究社区的垂直应用[105]。2.2. 本体语言与描述逻辑自20世纪90年代以来,许多本体语言被定义为允许NLP并支持语义网[106]。图2示出了一些定义语言分为传统的句法本体语言和标记本体语言。知识交换格式(KIF)是一种革命性的面向计算机的语言,用于各种计算机程序之间的知识交换。KIF语法本体语言[108] 还被Ontolingua语言[109]使用。框架逻辑(F-Logic)代表一种后续的基于框架和面向对象的语言,以表征知识和数据[110,111]。数据表示和存储,数据库信息交换,数据过滤和Web服务交互[112]也是可扩展标记语言(XML)[113]所涵盖的技能。RDF(资源描述框架)[114]已经被提出来统一网络上的知识,描述和交换图形数据。此外,XOL[115],一种基于XML的本体语言,已经被创建。LOOM[116]也被开发为基于描述逻辑(DL)的知识表示语言。DAML(DARPA Agent Markup Language)[117,118]G. Panzarella、P.Veltri和S. 阿尔卡罗生命科学中的人工智能3(2023)1000594图二. 本体语言时间轴。传统的语法本体语言用白色表示;标记本体语言(M-OL)用蓝色表示[106]。M-OL使用标记方案来编码知识,例如广泛使用的XML,它具有预定义的表示语义。一种旨在支持语义网发展的本体标记语言。SHOE是一种知识表示语言,它允许用语义对网页进行注释[8]。通过使用DAML和OIL(本体推理层)[119,120]语言的组合,我们有DAML + OIL[121]语言。OWL(及其后续版本OWL 2)是另一种可用的语言,由DAML + OIL语言开发[122]。它在2008年被发布并宣布为标准版本;这仍然没有改变[123]。大多数有效的本体语言都建立在描述逻辑(DL)的基础上[124]。DL是知识表示语言[125]具有正式的、基于逻辑的语义。DL推理可以应用于本体设计阶段以提高质量,也可以应用于部署阶段以利用本体和基于本体的信息的丰富结构。例如,SHIQ描述逻辑语言已经形成了几种本体语言的基础,包括OIL,DAML+OIL和OWL[126]。3. 本体开发环境(ODE)由于Web文档的指数增长以及机器学习、自然语言处理、信息检索和人工智能社区共享的尖端技术,本体学习正在成为本体工程的一个子领域。电子本体一般是手工创建的.这种创建本体的方法传统上被大多数本体工程师所使用,即使这种过程非常容易出错且耗时,这使得维护和更新本体变得困难。正因为如此,研究人员不断探索新的方法来产生或维护和更新本体,以有效和有效的方式[127]。本调查旨在突出本体生成的主要贡献,提供最流行和最广泛使用的本体开发环境(ODE)的描述,包括Protégé[128]、Topbraid Composer[26]、Ontostudio[27]、Flu [28]、[28][29]当为生命科学设计本体,这些ODE可以用于作为起点。如今,Protégé是最常用的ODE之一,其基于Web的版本为WebProtégé。该社区拥有超过350 , 000 名 注 册 用 户 [129] 。 它 是 在 斯坦 福 大 学 开 发 的 , ODEOntolingua[108]和Chimaera[130]已经被定义。类似的选择是TopbraidComposer[26],即使该工具几年前,OntoStudio[27](现在称为OntoEdit[131])是这个广泛使用的用于构建和维护本体的应用程序的初始迭代。2006年发布的NeOn Toolkit[132]就是在此基础上创建的。它为用户提供了基于设计模式的流程[133]。目前,它的效用似乎正在消退[133]。OBO-Edit[31]是一种面向生物学家的特定本体编辑器,是目前可用的ODE的另一个示例。其他例子是VocBench[29],一个仍然被许多企业使用的开源ODE,以及Fluent Editor[28]。尽管在W3C网站上被宣传为一个简单的本体编辑器,SWOOP[30]仍然缺乏一个项目网站。以下两个ODE在过去非常重要:KAON 2[134]和WebODE[135]。我们现在报告说关于图形工具的一些细节。3.1. 普罗泰热斯坦福大学生物医学信息学研究中心开发了Protégé[128],一个开源的本体编辑器和知识库。 它是编辑本体的合适工具,因为它使用户对OWL本体结构有了透彻的理解。在当前的本体编辑器中,它是最完整和最流行的选项。国家普通医学科学研究所支持它作为国家生物医学本体和知识库的资源。我们在下面列出了一些活动模块。1 主动本体:支持开发全新的本体 或者通过指定其寻址的目录(本体IRI)或URI(本体版本IRI)来打开现有的一个。可以检查RDF/XML和OWL/XML语言中的相关源代码,并且可以重新组织这些数据。2 实体模块:它是最关键的程序面板。在不忽视每个实体的层次结构和价值的情况下,它将组、属性和个人的类同时集合在一起。3 按类别划分的个体:它列出了包含在本体中的所有个体。在本节中,我们将研究个别注释和个别用法。我们可以添加类型或显示描述中是否有不同或相似的个体。属性断言框还允许用户报告对象属性和数据属性的肯定或否定断言。Protégé中有几个命令可用于创建实体;用户可以从“数据类型”、“个体”、“类”、“对象属性”、“数据属性”和“注释属性”中进行选择必须插入一个XIOMS来产生具有等价属性的类,包括它们子类的并集,以建立等价关系。关于EX探索和可视化功能,Protégé可以简单地探索本体[25]。类、数据属性、对象属性、个体、AX iom注释和查询等类别用于对建议的布局进行排序。Protégé可以使用所有注释、值或URI片段作为灵感,用自动创建的标签替换实体的名称,这些实体通常是没有任何意义的下面列出了一些插件和外部支持1 OWL Viz:它是标准Protégé 5.0软件包的一个组成部分,但它需要安装GraphViz;它允许人们查看图中实体的分类,它也是研究各种实体之间关系的有趣支持。生成的导航图可以保存并导出为图像文件。2 DL查询:通过DL查询来实现查询,以验证本体结构完整性的准确性。两个可访问推理器之一(例如,FaCT++、Pellet)必须在调用此支持时处于活动状态,因为根据OWL语法,它只能在本体已被分类的情况下起作用。一旦满足了这个基本要求,用户就可以继续制定和执行查询。该插件将收集所有相关的类数据、属性或个体到单个构造或框架中,以及层次关系,以便在本体内定位所选实体。G. Panzarella、P.Veltri和S. 阿尔卡罗生命科学中的人工智能3(2023)10005953 EX cel导入:此功能将EX cel或CVS文件插入本体中,并允许用户构建包含其内容的类并设置任意约束和限制。4 云视图:这个插件解释了本体的结构和应用。基本思想很简单:它实现了一个窗口,其中显示主要项目;使用的字体越大,链接的分数越高。评价标准的例子是使用频率单个术语的名称、在层次结构中的位置以及子实体的数量。5 书签:使用书签,您可以将类和属性拖到新视图中。相同的实体也被保留为注释,以便可以再次使用。6 OWLDoc:它包括两个组件:OWLDoc View和OWLDoc EX port。可以使用OWLDoc View创建任何类、属性或所选个体的动态视图。当演示结束时,OWLDoc EX port将其传输到一个目录,以便浏览器可以打开它。OWLDoc收集了一组静态HTML页面,这些页面可以提供给其他用户或发布在互联网上。3.2. 顶辫作曲家TopBraid Composer[136]是一个可视化的、包罗万象的知识图建模环境和SPARQL查询工具,用于在语义网标准RDF、RDFS和OWL中构建和维护领域模型和本体。 这个程序的免费、标准和大师版本都在2011年发布。它有一个可适应和可扩展的框架,具有用于创建基于浏览器或客户端/服务器语义应用程序的API。所有TopBraid套件组件都在一个不断发展的开放式架构平台中运行,使用户能够处理文件,数据库,具有类图的可视化编辑器,本体模型,RDF数据和语法指导的文本条目。内置的OWL推理引擎,SPARQL查询引擎和规则引擎提供所有的测试,ING , 一 致 性 检 查 和 调 试 。TopBraid Composer 通 过 整 合 XMLSchemas、UML、RDB Schemas和电子表格等遗留模型,使企业更容易迁移到语义Web标准。它可以与数据库后端一起操作,以增加可扩展性,并且有开放的API可用。 类似Protégé的概念包括创建基于模式的数据收集表单。 有几个可用的功能,如图形编辑器,可以用来轻松地构建本体。此外,类和子类可以被复制。TopBraid Suite部署平台称为TopBraid Live。它是一个语义Web应用程序平台,具有面向业务服务的体系结构(SOA)功能,能够动态地、按需地集成来自多个源的数据。Top- Braid Live[137] o除了一个综合库之外,还提供了一个复杂的系统来同步和缓存客户端和服务器之间的RDF数据基于Flex的可重用用户界面元素,如地图、日历、表单、搜索表单、图形、表格和树。3.3. OntoStudioOntoStudio 3.2.0[27]已经成为广泛使用和接受的工具[106]第一个问 题 是 如 何 构 建 和 维 护 本 体 论 的 。 它 的 前 一 个 版 本 被 称 为OntoEdit[131]。它是一个多语言编辑器和本体建模器,具有很多自定义选项。法语、英语和德语是可以定义同义词的语言。类,属性,规则,查询和映射都是它的一部分。这个编辑器支持OWL,RDF和ObjectLogic格式[27]。在启动项目时,用户可以选择自己喜欢的存储类型,包括内部存储库或协作服务器。不同的文件格式,如Xml,html,doc,ppt,pdf和postscript,可以存储数据。通过使用查询构建器,它提供了从数据库(如SQL数据库)获取数据的选项。查询生成器SQL的可用性使设计查询变得简单。一个名为On-toBroker的外部OntoStudio支持工具使用ObjectLogic和SPARQL来查询图形。SPARQL是W3C(万维网联盟)标准,也是用于RDF(SPARQL:SPARQL协议和RDF查询语言)。可以将OWL转换为对象逻辑、RDF/XML、Turtle、N-triples、n3、ANSI同义词等,使用OntoBrokerOntoBroker还可以与.net和java编写的程序进行通信。3.4. 流利的编辑Fluent Editor[28]是一个完全免费的开源软件。它通过安装必要的插件来增强Pro- tégé互操作性,允许用户使用自然语言编辑本体,并与大多数语义Web W3C标准一起工作[106]。使用选定的物化配置文件,用户可以将本体显示为交互式图表,并立即分析结果。Fluent Editor让用户可以访问SWRL语法分析器,这是一个用于创建实际本体和表达复杂条件关系的工具。嵌入式SWRL调试器的第一次迭代已经由开发人员提供,以帮助用户使用SWRL建模。它使得用户能够 查看哪些规则在实现过程中被付诸行动,以及哪些实体被用来代替它们的头部条款和主体。用户将专注于被更新的本体的真实含义(例如,分类法、词汇表、规则集)。使用R语言程序访问本体(rOntorion),Fluent Editor将统计与本体相结合,以执行定量和定性数据分析。使用Fluent Editor开发的本体可以通过rOntorion R包直接访问,这使得它们可用于R环境中的语义分析。3.5. VocBench 3VocBench 3(VB)是一个多语言的协作开发平台,具有用于管理OWL本体、SKOS(/XL)词库、Ontolex-lemon词典、通用RDF数据集和链接数据环境的语义Web编辑工具[29]。VocBench 3由欧盟委员会的ISA2程序维护[138],仍然被许多公共组织,企业和独立用户支持和使用,以保持他们的词库,代码列表和权威资源。欧洲大屠杀研究基础设施(EHRI)编辑委员会已将其用于EHRI大屠杀词库项目[139],TESEO意大利参议院[140],联合国教科文组织词库[141]和哈佛大学统一天文学词库(UAT)[142]项目。它是一个开源的;根据官方项目库,最近的更新是在过去的两年中进行的[29]。该平台的优势在于它强调协作、用户工作分散和内容验证和发布的工作流程管理,特别是对于需要分散但集中管理的发布环境的公司。3.6. 俯冲OWL本体浏览器和编辑器Swoop[30]是在美国马里兰大学创建的。W3C网站将其描述为一个紧凑而简单的本体编辑器,完全实现并可通过OWL访问。它有一个面向网络的方法,包括许多常见的浏览器功能:地址栏,历史按钮,书签和超文本导航。应用程序的主面板分为两个选项卡,是完成大部分工作的地方。Ontology Info面板提供了关于它的一般细节,比如名称、注释、实体计数和实体特征的统计信息。物种验证面板描述每个实体,并描述其特征或其在本体中假定的性质(类,属性或个体)。本体实体有三种不同的显示选项。人们可以创建一个所有现有实体的综合列表,按字母顺序排列,或者可以检查类或属性层次结构,建议使用树结构。此外,每个短语都与指定类别(类别、属性或个人)的符号相关联。Swoop用户可以选择从头开始构建一个全新的本体,或者使用已经跟踪的G. Panzarella、P.Veltri和S. 阿尔卡罗生命科学中的人工智能3(2023)1000596一种是通过“浏览”目录或在导航栏中键入URL。在其工作空间格式中,Swoop同时考虑了同一活动的各种本体,并支持项目的开发。Swoop附带了几个附加组件。一种是GCI(Generic Concept Illusion)AX iom);它允许使用“更改/注释”等注释注释)或“可编辑”,允许添加、更改和删除链接到实体特性的数据。数据和对象是两个范畴属性。个人可以通过使用为它们计划的命令来处理数据类型和对象断言、实例和关于探索和可视化功能,在主页上有一个关键字搜索字段。一个新窗口报告所有比较的类型化术语实体。内容探索是通过超文本的方法进行的,将导航转换为真正的浏览。它 也可以生成所提取的本体的图形表示。Swoop有一个“资源持有者”面板,一个保存项目的窗口。如果需要快速处理术语重叠和区别或查找常用对象,此面板可能非常有用。有两种推理机可用于数据的控制和分类1 Pellet:是一个必不可少的标准设备插件包,算是比较全面的。Protégé也默认使用它。将显示“颗粒查询”命令,可从“高级”栏访问该命令。它允许创建RDQL语言查询。主窗口中建议的树结构是从显示的结果超链接的。2 类RDFS:基于RDFS语义。它是更轻和更快的com-economy的颗粒。Swoop有BlackboX,一种诊断实体的方法。在这种方法中,推理者的任务是开发一组域;本体结构用于查明问题的根本原因。在发生冲突时,程序使用半形式化语言并插入一些可解释的公理,将事件原因显示在事件实体描述字段中。在这里,我们可以使用Run Tests,/ EX planation和Repair Ontology命令。我们可以使用版本控制来适当地维护我们的本体,并验证它们的实体是否被正确使用。 该工具支持两种操作:变更日志和检查点;它允许用户保持同一本体的各种迭代。变更日志描述了本体的进化路线,并按时间顺序列出了更改和调整。检查点提供版本之间的快速切换,显示当前型号的范围。Swoop支持所有RDFS/OWL关系结构,以便将实体传输到各种本体。为了重用其他作品中已经存在的实体,用户需要使用链接而不是纯粹的导入。Swoop目前不支持股票交易,但“简单的复制粘贴”可以提供一个解决方案。Swoop使用插件进行解释性过程和推理器控制在整个考试过程中。1 本体呈现器插件:它专注于本体解释,并且可以读取逻辑描述的表达性和实体的数量。它还可以读取现有的注释和识别- 使他们。最后,它可以识别在OWL物种中建立本体2 Annotea框架:它接受了将本体注释与核心隔离的想法;它允许使用可以扩展到注释的特定RDF词汇表,并且它提供了一种在Annotea组内部的服务器上发布它们的机制。结果是创建了一个新的注释类,称为An-notea Scheme。这个类记录本体修改,如果其中任何一个不合适,它会发送一个警告消息。本体图可视化插件和自然语言实体渲染器是两个额外的插件,作为附加组件对软件很有帮助3.7. OBO-edit基因本体(GO)联盟创建了OBO-Edit [31,79]项目作为其本体的一部分[34]。其目标是从科学和生物领域收集尽可能多的术语。OBO-Edit涉及三个特定主题:生物过程,细胞成分和分子活动。我们在本文中介绍的版本是2.00 beta 49。一个完全可定制的窗口包含所有的OBO编辑图形。新的插件可以添加到应用程序推荐的插件中。用户可以选择上传现有的本体或创建新的本体。它可以通过从网站下载特定的推荐包和特定的本体部分(由开发人员定期更新和维护)来获得,或者创建一个新的[143]。信息可以是异构的,可以包含OWL语言传统本体元素和内容。硬盘驱动器仅用于写入或保存文件;文件只能从中读取本地磁盘或URL地址。应用程序中包含了各种编辑器。树编辑器是程序中最重要的内容管理和导航面板。术语有一个图形符号,实体以层次结构排列。“曲线图编辑器”面板提供了一个表示本体形态的图表。用户可以直接在图形上更改实体和关系。文本编辑器允许用户更改单个特征实体,父编辑器允许更改所选实体的属性,例如超级实体,包括链接,单词和名称空间。OBO-Edit还包含特定的方法,如实体命名空间的修改,ID,将根插入本体路径和某些属性中的真/假布尔属性。OBO-编辑操作包含两个不同的取消概念:删除命令,通过将关联实体带到过时的术语来从本体中删除关系;以及销毁操作,从本体中永久删除现有实体。研究部分使用两个面板:1 搜索面板,用于在本体中搜索术语2 链接搜索面板,这是需要调查的类型 父母和孩子的ID实体之间的关系查看器栏命令:术语图像显示面板、图形、Graphviz和树查看器专用于实体可视化的层次结构。OBO-Edit可以通过按时间顺序或- 德。每当用户进行更改时,应用程序都会创建一个历史,其中记录了与所采取的操作有关的所有信息,将其添加到“历史浏览器”中的列表中。OBO-编辑-提供了与Protégé和Swoop不同的推理机选择,因为它不是插件,而是开发人员内部计算的代码的组成部分。前向链接或链接堆推理器在OBO编辑中起着至关重要的控制作用,OBO编辑还配备了所谓的“语义解析器管理器”算法,该算法具有执行术语的纯语法分析的功能。控制和检查也通过本体验证进行,它会立即提醒用户可能危及准确性的致命错误。检查在本体生命的非常特定的阶段自动执行,例如当它被加载时,当文本字段被更改时,以及在使用文本编辑器时,它也会跟踪所采取的操作的反馈。有许多不同的对照研究,范围从检查术语名称和相关ID到浏览同义词和分离特征。如果用户需要手动操作程序控制系统,则必须使用验证管理器。该窗口包含允许的各种检查的列表。 最后,我们提到了交叉积的概念,也出现在Protégé和Swoop中,但是 在这种情况下有不同的含义。在OBO-Edit中,Cross Product表示类之间的交集或关系,以确保识别本体中的所有层次对应。在Protégé和Swoop中,G. Panzarella、P.Veltri和S. 阿尔卡罗生命科学中的人工智能3(2023)1000597叉积定义了两个独立本体的实体之间的关系。3.8. 软件对比我们现在提供一个一般的ODE比较。表3收集了一般讨论的工具特性。表4收集了可用性、可扩展性、稳定性、集成性、文档和独创性的工具方面。每个特征的评分范围从最小1到 最多3颗黄色星星。3.8.1. 可用性可用性涉及到软件使用的访问简单性。软件设置和图形界面在这方面也有重要作用。OntoStudio和TopBraid Composer可在市场上买到,而Protégé、Fluent Editor、VocBench、Swoop和Obo-edit是开源应用程序。Swoop是基于Web的,Protégé、OntoStudio和Swoop具有客户端/服务器 架构。Protégé 、OntoStudio 和Top-Braid Composer Free Edition(FE)使用数据库存储本体。我们的分析将更多地关注开源工具。普罗泰热在可用性方面,是一个完整的、包罗万象的软件套件。它提供了一个很好的图形界面,并支持深入的本体研究。FluentEditor为Protégé提供了互操作性,自然语言的本体编辑,插件支持,与大多数语义WebW3C标准和许多其他功能的兼容性,并且免费用于学术和个人应用。VocBench也是另一个ODE,被许多组织使用和支持。它是一个开源的;根据向官 方项 目库提 供当 前日历 年的 最新 修订日 期。 TopBraidComposer也很强大,主要是从专有版本中获利。有一个免费的版本,但它是 不再维持。几年前,OntoStudio是用于构建和维护本体的最广泛使用的商业程序。值得注意的是,NeON Toolkit是基于它的,它的前身是广泛使用的ODE OntoEdit。尽管有某些内容和功能限制,Swoop仅限于不需要在其本体上执行非常复杂的操作的个人,因此它 被认为是最友好的工具它的程序员创建了一个布局和一个完整的应用程序,基本上类似于Web浏览器的指导原则。OBO-Edit也计划是友好的,允许满足其用户的需求。因此,它似乎比其目标详尽,即使它原来是最先进的软件包在可用性方面。在OBO-Edit中,用户可以从各种本体访问方法中进行选择,包括下载定义的引用包,特定的本体组件或全新的本体[143]。3.8.2. 扩展性可扩展性是指应用程序可以集成软件包或插件。本研究中检查的所有程序都计划允许额外的支持和/或插件来增强其性能。Protégé无疑是具有更大改进潜力的程序,因为它的广泛使用;它是 许多机构正在努力采取主动行动,为这一软件包开发插件。因此,它已率先在研究和教育领域。Protégé插件库包含几个项目;其中一个插件是SKOSed[144]。Swoop、Fluent Editor和VocBench也在努力开发插件,处理大量数据,同时仍然提供友好的环境。OBO-Edit是唯一一个处理这个问题较少的程序,因为它是为特定的本体而设计的,而不是作为一个通用的编辑器。TopBraid Composer基于开放的插件结构。这方面的高级功能可在其标准版(SE)和大师版(ME)上获得。Fluent编辑器提供了两个插件,一个Protégé互操作性插件和一个使用RONTORIONPAKAGES来组织本体内容的R插件。VocBench 3支持提供额外功能的插件表3软件比较表示。工具功能支撑平台Tobraid作曲家Windows,LinuxX,普罗泰热Windows、LinuX、MacOSX、Sun、Solaris、HPLIX、IBMO
下载后可阅读完整内容,剩余1页未读,立即下载
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 电力电子系统建模与控制入门
- SQL数据库基础入门:发展历程与关键概念
- DC/DC变换器动态建模与控制方法解析
- 市***专有云IaaS服务:云主机与数据库解决方案
- 紫鸟数据魔方:跨境电商选品神器,助力爆款打造
- 电力电子技术:DC-DC变换器动态模型与控制
- 视觉与实用并重:跨境电商产品开发的六重价值策略
- VB.NET三层架构下的数据库应用程序开发
- 跨境电商产品开发:关键词策略与用户痛点挖掘
- VC-MFC数据库编程技巧与实现
- 亚马逊新品开发策略:选品与市场研究
- 数据库基础知识:从数据到Visual FoxPro应用
- 计算机专业实习经验与项目总结
- Sparkle家族轻量级加密与哈希:提升IoT设备数据安全性
- SQL数据库期末考试精选题与答案解析
- H3C规模数据融合:技术探讨与应用案例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)