没有合适的资源?快使用搜索试试~ 我知道了~
工程科学与技术,国际期刊20(2017)1025完整文章糖尿病领域案例库知识的模糊本体建模Shaker El-Sappagha,Mohammed Elmogyb,a埃及Minia大学计算机信息学院b埃及曼苏拉大学计算机信息学院阿提奇莱因福奥文章历史记录:2016年12月29日收到2017年3月22日修订2017年3月27日接受2017年4月29日在线发布保留字:案例推理语义检索案例库表示模糊本体糖尿病诊断A B S T R A C T知识密集型案例推理系统(KI-CBR)主要依赖于本体。本体可以起到案例库知识的作用。本体论与模糊逻辑推理的结合在医学领域具有重要意义.基于模糊本体的案例库表示方法有望增强CBR知识库的语义和存储能力本文提出了一种基于实例的模糊OWL2本体(CBRDiabOnto),为基于实例的故障诊断CBR的研究提供了新的思路该本体可以被认为是医学领域第一个模糊案例库本体。它是基于一个基于实例的模糊扩展实体关系(EER)数据模型。它包含63个模糊类、54个模糊对象属性、138个模糊数据类型属性和105个模糊数据集。我们用60个案例填充本体,并使用SPARQL-DL进行查询。CBRDiabOnto的评价表明,它是准确的,一致的,并涵盖糖尿病诊断的术语和逻辑©2017 Karabuk University. Elsevier B.V.的出版服务。这是CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍知识密集型案例推理(KI-CBR)的成功取决于其案例库(CB)的结构和内容。本体以人类能够理解的机器可读格式构建领域知识。它可以在CBR系统中作为一种知识表示形式,用于指定领域背景知识和CB知识[6]。KI-CBR使自动推理的语义知识,除了句法属性的情况下。本体支持创建语义检索算法,以增强CBR系统的智能[14]。它提供了域的概念化,域由概念、属性和公理组成。它已被用于许多医疗[15]和非医疗[6]CBR系统。在糖尿病诊断中,本体论在CB、背景知识和病例检索中还没有得到充分利用。El-Sappagh等人[22]提出了用于DM诊断的清晰CB OWL 2本体,基于SNOMED CT1(SCT)的背景域本体[23],来自电子健康记录(HER)数据的CB准备模型[24],并基于提出的编码方法对CB进行编码[27]。然而,知识的不精确性问题*通讯作者。电子邮件地址:melmogy@mans.edu.eg(M. Elmogy)。由Karabuk大学负责进行同行审查1http://www.ihtsdo.org/snomed-ct/。在KI-CBR范例中尚未处理[3]。医学数据,如糖尿病诊断,大多是不精确的,基于经验。CBR在这个领域的成功取决于如何处理这个问题根据Zadeh[63]的说法,许多人类经验知识是不精确和不准确的。这种知识必须以适当的方式进行操纵,以防止基于知识的系统的效率低下。在许多研究中,模糊集已经与CBR集成以生成Fuzzy-CBR,如[31]。然而,他们没有利用模糊本体(FO)的情况下表示和案例检索导致CBR系统,这可能会失去许多语义推理能力[3]。需要一种机制来利用本体作为将模糊语义引入KI-CBR的“载体”. FO将模糊集理论集成到清晰的本体逻辑,工具和语言中[18]。Bobillo和Straccia[9]提出了一个扩展的清晰OWL 2生成模糊OWL 2本体。清晰本体的模糊化需要翻译成FO推理器支持的语言,如fuzzyDL[9]。我们断言,FO支持清晰的方面,以及模糊的方面。例如,在糖尿病诊断领域中,存在与其他相关的清晰成分(如性别和居住地)、模糊成分(如年龄和实验室检查)和语义成分(本体论,如SCT。模糊本体已经在许多领域得到了应用。例如,Rodríguez等人[57]提出了一种FO来模拟人类行为。Ali等[5]在意见挖掘中使用它Lee等人[43,44]使用FO和模糊集对糖尿病在饮食和诊断中的应用进行建模http://dx.doi.org/10.1016/j.jestch.2017.03.0092215-0986/©2017 Karabuk University.出版社:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表工程科学与技术国际期刊杂志主页:www.elsevier.com/locate/jestch1026S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)1025此外,它在一些人工智能系统中被管理为基于规则的系统[45]。FO与基于规则的系统的使用比其他系统更不适用,因为这些系统需要收集域的显式模型对于数据挖掘来说,收集建模它的规则集是一个挑战,因此,有可能开发出避免知识获取瓶颈的CBFO 扩展了CRISPR的功能,提高了CBR在医学领域的准确性和适用性[3]。Park 等 人 [52] 将 明 确 本 体 应 用 于 船 舶 避 碰 的 模 糊 CBR 系 统Alexopoulos等人[3]尝试使用模糊代数为CBR构建FO。他们提出的本体论是为电子图书馆设计的而利用关系数据库和概念数据模型构建模糊本体是构建CB模糊本体最合适的形式。因此,患者CB通常从患者病史的EHR数据库中获得[10]。 在任何医学CBR系统中,对FO的研究都很少。 据我们所知,目前还没有文献提出一个DM诊断模糊CB本体。模糊CB本体可以从许多来源创建[64]。模糊EER模型的翻译比其关系模式更好,因为EER具有更丰富的语义,并且EER模型与本体结构密切相关[64]。此外,许多研究提出了从模糊EER模型到FO的映射[46]。此外,慢性病管理需要从患者的(分布式)EHR中收集病例。El-Sappagh等人[25]提出了一个使用HL 7 RIM的案例库数据模型。2需要一种方法来模糊化该模型并将其映射到模糊CB本体。由于本体提供了共享概念化的形式化表示,因此CB FO可以与DM标准领域本体相结合,以支持与EHR环境的共享和互操作性[23]。虽然有许多研究在模糊EER模型的创建和翻译成模糊本体和模糊DL[46,47],很少有研究利用他们的结果在CBR,特别是在医疗领域的DM诊断。EER模型的大多数模糊化策略依赖于一个语言值来表示一个特征[12]。这些方法限制了查询问题描述的灵活性。它们限制了检索算法的效率。本文提出了解决这一问题的策略。在本文中,我们设计了一个新的本体称为CBRDiabOnto。它是一个OWL2模糊CBR本体,可以表示任何CBR系统的DM诊断知识.研究了CB模糊本体的知识表示形式。该本体已被用于构建整个CBR系统[26]。不同类型的特征,包括文本,序数,语义,数值和模糊类型,可以建模所提出的本体。结果表明,在模糊CBR系统中,生成的知识库支持语义推 理 、 清 晰 推 理 和 模 糊 推 理 本 文 的 其 余 部 分 第 二 部 分 给 出 了CBRDiabOnto模糊CB本体的构建过程。第三部分是CB本体的查询方法。第四节对所提出的模糊本体进行了评价.最后,第5节给出了结论和未来的工作。2. 相关工作传统CBR已在许多研究中用于糖尿病诊断[48,40]。这种范式的一个演变是基于本体论或KI-CBR[6]。本体在增强CBR语义方面扮演着许多角色[20]。这种方法通常比传统方法更有效地表示、索引、维护、调整和检索类似病例[30,37]。案例语义检索可以通过使用本体形式的案例库和领域背景知识来增强[30]。Amailef和Lu[6]提出了一个移动政府应急响应服务的领域本体,以CBR为基础。El-Sappagh等人[23]提出了一种基于SNOMED CT的CBR系统的糖尿病领域本体。然而,CBR系统从根本上依赖于基于案例的知识表示[30]。因此,Heras等人。[38]提出了一个清晰的案例库本体论,用于基于案例的论证系统,名为ArgCBROnto。Zhukova等人[65]为人力资源管理系统提出了一个清晰的案例库本体。在糖尿病领域,本体已经在许多CDSS中使用[61,54]。然而,关于糖尿病诊断,没有一个现有的本体是为CBR设计的,并且很少有研究在CBR中使用本体[61,40];这些研究非常抽象,并且仅将本体用于领域知识。Jaya和Uma[39]列出了本体在糖尿病诊断CBR中的作用。 El-Sappagh等人。[22]提出了一个清晰的OWL 2本体用于糖尿病诊断案例库。该本体可用于案例的语义存储和检索。另一方面,糖尿病的诊断取决于医生的经验和病人对病情的描述。医学领域中的模糊性可以使用模糊逻辑[63]来处理,模糊逻辑已用于基于规则的糖尿病诊断系统[45]。此外,模糊逻辑已经与CBR集成在混合系统中[1],并用于计算案例之间的模糊相似度[41]。最近,Sohn等人。[59]将模糊CBR推理与清晰本体推理相结合,用于智能家居环境中的个性化服务。然而,这种混合系统并没有受益于模糊本体推理能力。明确本体在CBR环境中取得成功后,模糊本体本体论可以扩展清晰本体论的优点[4]。构建基于案例的模糊本体是一个挑战[52]。Alexopoulos等人[3]利用模糊代数提出了一种模糊案例库本体关于糖尿病,它在许多领域中使用了模糊本体[45,44]。Lee和Wang[45]提出了一种五层模糊本体,并将其用于糖尿病患者的模糊专家系统Lee等人。[44]提出了糖尿病患者饮食管理的2型模糊本体。虽然CBR更适合于处理糖尿病诊断等病态问题,但目前还没有基于模糊本体的糖尿病CBR,也没有基于模糊本体的案例库构建的研究。清晰的本体不适合解决不精确和模糊的知识,这是现实世界领域中固有的[57]。有许多技术可以开发清晰的本体[22]。然而,它们不足以用于模糊本体构建[64]。许多技术可用于生成模糊本体,包括:扩展现有的清晰本体[4],映射关系数据库模式,映射模糊ER模型[64],映射模糊EER模型[64],模糊形式概念分析[19]和其他数据源。 这些方法之间的区别主要在于模糊化了清晰本体的哪些方面,而这些方面取决于领域需求。像OWL 2这样的表示语言需要能够表示模糊本体。有两种方法可以扩展语言本身[60],这会改变语言的结构,或者使用当前语言来表示模糊方面。Bobillo和Straccia[9]使用注释来表示常规OWL 2中的模糊。3.在第二种选择的基础上,提出了一种基于实例库EER模型的模糊实例库本体结构(TBOX)。基于模糊集理论,将EER模型扩展为模糊EER模型,并将此外,我们填充与EHR数据库(ABOX)的情况下,产生的本体,我们提供了一种方式,语义查询产生的情况下,本体。本文的主要贡献如下:1. 我们根据我们的CB模式[26]提出了用于DM诊断CB的EER数据模型。2http://www.hl7.org/implement/standards/rim.cfm。3http://www.straccia.info/software/FuzzyOWL/。S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)102510272. 利用模糊集理论将该模型模糊化为模糊EER模型3. 我们提出了一种方法来映射模糊EER模型到一个模糊CB本体,并实现这个本体在OWL 2使用Protégé 4.3模糊插件。4. 我们从模糊CB数据库的实例填充产生的本体。本体包含63个(模糊)类,54个(模糊)对象属性,138个(模糊)数据类型属性,105个模糊数据类型和60个真实案例。5. 我们提出了一种方法,模糊语义查询的模糊知识库。由此产生的CB模糊本体可用于建立糖尿病诊断的CDSS,用于疾病治疗。3. 模糊本体论模糊集理论可以应用于三个层次的清晰ER模型[66]。EER模型是对ER模型的扩展,增加了一些面向对象的符号,如泛化/特化和聚集。许多研究提出了模糊EER模型的定义[64,47],本文的实例库清晰数据模型到模糊EER模型的转换我们不像[3]中那样使用OWL的模糊扩展进行模糊化。模糊方面在常规OWL 2语言中使用模糊OWL 2语法[9]建模为注释,为了实现,我们将使用模糊OWL 2protégé4CBRDiabOnto构建过程基于将糖尿病CB EER模型映射到模糊本体。如图1所示,第一步生成基于实例的清晰EER模型。该步骤详见第3.1节。下一步是将该模型扩展到模糊EER模型。该步骤在第3.2节中讨论。然后,使用形式化方法将生成的模糊EER模型映射为FO结构(TBOX)该步骤如第3.3节所示。最后,生成的本体填充模糊数据库(ABOX),这是等效的模糊EER模型的实例。该步骤详见第3.4节。3.1. 实例库EER模型步骤我们选择糖尿病诊断领域作为我们的案例研究。糖尿病(DM)包括一组代谢紊乱,其特征是由胰岛素分泌、胰岛素作用或两者缺陷引起的慢性高血糖状态[7,13,28]。每个案例都有描述和解决方案。外壳结构:其中P是问题描述,包括患者症状和实验室测试结果。这一部分由64个特征描述。年龄;BMI;居住地;性别;职业;KiF;Lab;UrS;HaPg;其中LiF=肝功能检查,LiP=血脂谱,GlS=全身症状,KiF=肾功能检查,Lab=实验室检查,UrS=排尿症状,HaP=血液学特征。解决方案S(P)由五个特征描述;它是DM诊断(DM,前驱糖尿病,妊娠期DM和前驱糖尿病妊娠)和患有与肝脏和肾脏相关的其他并发症D;L;N;C;Hg其中D= DM诊断,L=肝脏问题,N=肾病问题,C=癌症类型,H=高胆固醇血症问题。数据集的完整描述见参考文献[26]。在另一项工作中,我们提出了一个基于HL7 RIM和SCT本体的标准CB数据模型。标准的定制版本4http://nmis.isti.cnr.it/。我们的CB脆EER模型已在[27]中描述。每个患者都是由该数据模型中的行或向量表示的病例。案例是10个实体的集合。这些实体有70个特征。通过这些特征描述患者,并且CBR系统将建议对患者状况进行诊断。有些特征是字符串数据类型,如性别和居住地。其他依次为视力、口渴和疲劳。大部分的特征是数值型的,属于模糊属性。3.2. 模糊EER模型步长为了对模糊EER进行建模,我们使用了参考文献[1]中的符号[49].每个清晰的值被模糊化为所有属性为了支持使用相似度矩阵的相似度计算,使用单个模糊标签来描述特征例如,如果BMI属性表示具有模糊值{体重不足、正常、超重和肥胖}的语言变量,并且这些值由一些模糊函数表示,则BMI = 30被建模为 l体重不足20:20、l正常30: 20:52、l体重超标30: 20:48、l肥胖30:20,以及BMI代表性语言标签正常,其具有最高隶属度值。语言标签有利于模糊查询公式化。我们在领域专家和DM诊断临床实践指南(CPG)的指导下,使用MATLAB对所有70个数值特征进行模糊化,如图2所示。在建立模糊EER模型时,采用了一组属性来体现这一思想。我们从所使用的所有类型的数据中选择属性,包括模糊数值(例如2hPG、BMI、血清尿酸、白蛋白和总胆固醇)、非模糊序数(例如视力、酮)、非模糊语义(例如肾病、肝病)和非模糊文本(例如居住地)。在该图中,所有模糊特征都使用FUZZY关键字和星形图表示。主键是带下划线文本的黑色星号模糊实体是虚线轮廓矩形,模糊关系是虚线轮廓菱形,并且l是模糊隶属度。我们支持-姿势,以扩展所有属性与模糊类型,以模拟在九月,因为这些属性是复合的和多值的。例如,模糊年龄属性被建模为F_Age实体,其具有存储每个模糊值的成员值的属性、存储其清晰值的属性以及存储其描述性语言标签的属性,如图4所示,其中年龄特征被建模为3个模糊项和2个附加属性。这种建模决策简化了模糊EER模型到其等价FO元素的映射。因此,图3中的模糊EER模型被扩展到图5,图5更详细。3.3. CBRDabOnto实施(TBOX)步骤CB模糊EER模型提供了本体元素,如概念,属性和公理。然而,要建立一个高质量的模糊本体,它正确地描述了一个领域,一个正式的方法必须遵循[8]。由于FO是一个扩展到清晰的本体,我们按照建议的本体工程方法,埃尔萨帕等人。[22]第20段。但由于篇幅限制,其步骤在此不作详述。根据图5中所提出的案例库EER模型,将该模型转换为OWL 2 FO是准确的。关于EER到模糊本体转换的规则有很多研究,文献[1]提出了一些完整的[64、46]。表1提供了它们的对应关系的一个小列表。模糊OWL本体的创建包括两个步骤。首先,本体结构(TBOX)的创建,这是本节讨论的。第二,本体实例的创建(ABOX),1028S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)1025Fig. 1. 模糊本体构建框架。图二. 数值属性模糊化。图三. 基于实例的模糊EER模型。见图4。 一个模糊数据类型的例子。这将在下一节中讨论。整个本体已经在Protégé 4.3及其Fuzzy OWL插件5中创建,5http://nmis.isti.cnr.it/。实现所得到的模糊CB OWL 2本体。所有以下编码都基于Bobillo和Straccia的语法[9]。对于每个模糊值,例如young_age,我们在protégé中定义一个模糊数据类型。模糊OWL插件有四个模糊数据库(例如,S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)10251029图五、扩展实例库模糊EER模型。表1模糊EER模型结构与模糊OWL本体之间的对应关系EER模型元素模糊OWL本体元素EER模型元素模糊OWL本体元素脆实体Crisp类标识符属性数据属性标识符模糊实体模糊类标识符模糊属性模糊数据属性标识符关系类标识符作用对象属性标识符基数(最小和最大)基数公理模糊实体的实例个体标识符m个实体m对模糊对象属性识别分类联盟.. .左(k1,k2,a,b)、右(k1,k2,a,b)、梯形(k1,k2,a,b,c,d)和三角形(k1,k2,a,b,c))[26]。根据图2中的模糊化,我们从这些模糊数据类型中进行选择。该插件允许为类、关系和模糊数据库定义模糊修饰符(即, mod ( C)、mod ( R )和mod(d),其中C是概念,R是关系,d是模糊数据类型)[26]。此外,模糊关系和模糊公理的实现。所有的本体元素都是从其等价的EER模糊模型中提取出来的每个已识别元素的实现的小样本如下所示。3.3.1. 模糊数据类型和模糊数据属性三种类型的东西被定义为每一个数值特征。第一,数字特征作为一个整体的抽象作用。第二,每个语言术语的模糊数据类型。第三,模糊的具体角色(即,对象属性)。考虑到HbA1c实验室检查值,假设首先,我们创建一个名为HbA1c的抽象角色。其次,为这些模糊术语中的如图 6,一个 protégé插件见图6。 一个模糊数据类型定义的例子。1030S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)1025½]! 半 ]9ðÞ已被用于创建数据类型lowA1c,然后将其注释为模糊数据类型。在我们的CB模糊本体中,对每个模糊变量中的第三,一个模糊的具体作用已被定义为所有的语言价值。以前定义的模糊数据集被用作这些 角 色 的 范 围 继 续 HbA1c , 我 们 定 义 了 三 个 模 糊 具 体 角 色hasLowA1c、hasNormalA1c和hasHighA1c。例如,hasLo-wA 1c已被建模为hasLowA 1c(HbA 1c,lowA 1c),其中HbA 1c是明确的概念,而lowA 1c是模糊的数据类型。3.3.2. 模糊修饰符、模糊修改数据类型和模糊修改角色修改器提高了本体的表达能力和语义查询能力。模糊修饰符更改模糊数据类型的隶属度。模糊修饰符是一个函数f mod :0; 10; 1,其中可以是L(c),Tri(a,b,c)[26]。模糊修饰符允许我们定义一个公理如Has Age:veryoung,如果我们有一个对象属性Has_Disease(Patient,Disease),我们可以定义very(Has_Disease)或最 近 ( Has_Disease ) 领 域 专 家 帮 助 将 modifies 值 定 义 为 very 、slightly、somewhat等。在我们的工作中,这些修饰符可以修改以下内容(根据Bobillo和Straccia[9]的模糊本体语法:1. 数据类型:例如,数据类型veryLowA1c是lowA1c的修改版本:2. 模糊的具体作用如下所示。3.3.3. 模糊修改的数据类型属性定义了两个模糊数据属性:has-Disease(定义疾病的严重程度)和lived-In(模拟一个人在农村或城市的停留它们被建模为模糊的修改角色例如,has-Disease角色可以在新角色very-has-Disease中被very修饰符修改为:3.3.4. 模糊逻辑我们选择Zadeh模糊逻辑CBRDiabOnto。这被实现为本体级注释:图7示出了基于JCOLIBRI 2 CBR框架[56]的CBROnto标准CB本体所创建的OWL 2模糊CB本体的快照。Heras et al.[37]这是一个很好的例子。CBROnto本体作为顶层组织元素工作。这种格式便于使用JCOLIBRI 2 API(一个完整的CBR API)进行案例检索、调整、修订和保留。CBROnto提供了CBR的几个不相交概念的顶层抽象。这些概念包括基本概念CBRCASE,它表示知识库中的案例实例 列 表 , CBR_INDEX , 它 表 示 案 例 特 征 概 念 列 表 , 以 及CASE_COMPONENT,它包含案例的最抽象的组件,包括不相交的概念CBR_DESCRIPTION和CBR_SOLUTION。此外,CBROnto还提供了一组关系来链接前面提到的概念,如Has_Description和Has_Solution。下面是一个非常简短的本体公理列表,其中d是每个模糊变量的语言术语的用户定义的模糊数据类型(参见在El-Sappagh等人[26]中,实例是SCT概念的ConceptID:S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)10251031见图7。 提出了基于实例的模糊OWL 2本体。所得到的本体包含62个类,58个(模糊)对象属性,138模糊数据类型属性,105模糊数据集,1316公理,761逻辑公理,和2640个概念实例的60例患者。每个对象属性和数据类型属性都有一个实例用于每个单独的情况。此外,模糊OWL插件不支持因此,我们无法实现模糊对象属性Has_Disease,它表示疾病的严重程度或其年数,和Lived_in,描述患者存活的时间长度在农村或城市。聚合建模将每个案例与其组件结合起来。我们已经创建了一个对象属性Has_Part和它的逆属性Belongs_To,它们将病例的所有部分链接到病例描述概念DiabetesDiagnosisCase,如图8所示。我们已经创建了一些公理,以确保每个案例都有来自每个组件的一个概念,如图所示。9 .第九条。可以使用SWRL将规则添加到生成的本体中,以执行和推断一些逻辑,例如Patient_Case(?)x)^Has_Gender(?x,“男性“)!:已诊断-1032S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)1025图8.第八条。OWL 2中的聚合建模见图9。 从每个组件中收集一个实例的事例公理。鼻子(?x,"糖尿病“)。这些规则可以帮助推断新查询问题的缺失特征下一步是用来自EER数据库的实例填充生成的本体结构。换句话说,我们将数据对象实例映射到模糊OWL本体个体。接下来将讨论这一步骤表2从模糊EER模型实例到模糊OWL本体的转换模糊OWL本体实例模糊对象实例模糊个体标识符属性值数据属性断言关系对象属性断言.. .S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)102510331/1我见图10。图1给出了基于实例的模糊EER模型中的实例信息片段。 五、见图11。 模糊数据元素与模糊本体的映射。3.4. CBRDiabonto实例化(ABOX)步骤本体填充有许多选项。本体实例可以存储在数据库中,并且基于本体的数据访问算法用于语义地访问实例数据库[32]。此选项支持本体的缩放,因为对存储在数据库中的实例的数量没有限制函数式语法。图13示出了图11中建模的CB模糊EER实例片段的实例化。10,其中案例被表示为一组本体个体和关系(即,适当的关系)。一些推理机,如Pellet,支持规则推理和推理。因此,我们可以实现一些规则来断言一些公理,例如对于每个模糊属性值:但它的推理能力将受到影响[33]。另一种选择是将本体结构和实例存储在同一结构中,这是本文的选择。我们已经建立了一个模糊数据库的建议模糊EER模型,并填补了60例糖尿病患者。这些数据是从埃及Mandarin大学医院的60名患者的EHR中收集的。此数据用于填充CBRDiabOnto。从模糊数据库实例到FO实例的一组转换规则如表2所示。为了说明转换过程,我们给出了图5中的模糊EER模型的实例,数据如图10所示,其中数值特征的每个值都根据所选的隶属函数进行了模糊化。将模糊EER模型的符号转换为模糊OWL本体的标识符。CBROnto本体的所有实例都将从讨论中省略以简化过程。图3中的属性的模糊值已经在如图5所示的单独实体中被建模,并且它们用如图11所示的EER的对应数据库模型中的数据填充EHR数据库(图11a)被转换为模糊数据库(图11b),并且所得到的数据被用于填充本体(图11c)。此外,FO已建成支持图中相同的结构。 五、图12示出了图5中的CB模糊EER结构片段的所得本体结构。使用的语法是OWL 2i=成员值。虽然存在针对FO人群的protégé插件,例如FEER 2FOnto[19],它们与我们的工作不完全兼容。因此,我们可以使用API进行本体编程,例如OWLAPI 3,Jena,protégé API或Pellet API。我们选择OWLAPI3.7来实现我们的FO种群算法.我们得到的本体结合了许多数据库和许多推理(即,模糊、CBR和本体推理)。因此,它支持许多模糊语义检索和查询算法[51]。首先,模糊标签用于扩展查询实例描述和确定查询评价中的模糊术语之间的模糊相似度。由领域专家分配模糊标签之间的语义相似度,并使用相似度矩阵进行度量。其次,为每个语言值分配模糊隶属度值列表,提高了模糊相似度算法的准确性。第三,原始清晰值的存在允许模糊相似性度量和清晰相似性度量的结合。第四,可以定义模糊模糊限制语,丰富了查询描述和相似度计算。最后,存在的语义值,如病人的疾病,这是连接到其他本体,增强语义检索相似的情况下。而且6https://www.w3.org/TR/owl2-syntax/。7http://owlapi.sourceforge.net/。n =模糊值的数量,l1034S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)1025图12个。图1的模糊OWL本体结构的一部分。 五、图十三. 图1的模糊OWL本体实例的一部分。 10个。由此产生的本体允许处理抽象和不完整的问题描述[53]。由于许多情况可以引用相同的特征描述对象,因此实现了存储保留。例如,如果我们有n个情况C1,. . ,Cn,其中Age = 45,那么我们创建一个Age对象,并使所有n个case都指向该Age对象。案例可以与其他案例有关系,例如CivCj。4. CB模糊本体查询本体的主要目的是将其用作CDSS中本节讨论了CBR系统中的主要步骤(即,案例检索)。 图14提出了用于CB模糊本体的模糊语义查询的框架。如图15所示,问题被格式化为没有解决方案的查询案例,其中医生能够使用GUI输入患者特征。 查询用例是向量V =< attribute i= valuei>,对于i 是特征的数量,即,<年龄= 20,BMI = 40,居住地=“农村“,疲劳=“”++“,根-der='' Male“.. . >。在这个层面上没有语义这个向量将被传递到查询解析器(图14);他的模块有两个功能,即模糊化和基于SCT的编码[27]。矢量中的数字特征使用与用于模糊化知识库中所有案例的隶属函数相同的隶属函数进行模糊化S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)10251035图14. 模糊语义查询公式化和执行引擎。图15. 模糊查询输入表单。(see图2)。结果数据的结构如图11b所示。将使用领域背景知识本体对所得到的模糊向量中的语义特征进行编码,以支持语义检索[36]。其他功能保持不变。我们利用我们以前提出的SCT OWL 2本体作为背景知识,用于测量医学概念之间的语义相似性[23]。根据CBRDiabOnto词汇表,Ontological Query Transformer将查询case向量转换为包含OWL 2个体和属性实例的语义查询,如图11c所示。图16示出了对先前的查询向量V使用OWL 2功能样式查询的示例。案例检索由基于本体推理器和SCT的案例检索模块有许多选项用于查询CB模糊本体。查询和OWL本体可以被序列化为RDF形式,并且SPARQL8语言用于在本体上形成类似SQL的查询[42]。然而,SPARQL对OWL语义的理解是不完整的,因为它将语言的语法与断言混合在一起[50]。此外,一些OWL构造没有规范的RDF序列化,不同的工具可以以稍微不同的方式序列化相同的OWL构造9 f-SPARQL扩展了SPARQL的功能。然而,它没有标准,需要对OWL 2进行扩展[16]。规则推理和查询可以通过SWRL和语义查询增强的Web规则局域网来实现。8http://www.w3.org/TR/sparql11-query/。9http://www.w3.org/TR/owl2-mapping-to-rdf/。1036S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)1025图16. 查询事例表示的一部分。图17. 一个语义查询的一部分,对图的情况下,基础。 十六岁[50]第50话:SQWRL内置了用于数学和逻辑计算的库,这有助于实现检索算法。此外,SQWRL免费API促进了Java应用程序的实现,用于在本体上进行案例10SPARQL-DL语言可以直接查询OWL 2本体,这是最佳选择,因为它充分利用了OWL 2的语义能力[58]。它是SPARQL的一个子集,对应于DL中的合取查询,并且它使用SPARQL syn- tax。SPARQL-DL查询引擎建立在OWL API之上3. 我们使用SPARQL-DL JAVA API11和SQWRL JAVA API的组合来构 建 我 们 的 模 糊 语 义 查 询 执 行 引 擎 , 如 图 14 所 示 。 Has_Part 和Belongs_To对象属性实现了聚合和Has_ID数据属性,用于确保所有选定的概念都链接到一个案例。我们使用JAVA和OWL API 3来实现图1中的案例检索模块。 十四岁公式化的语义查询被传递到支持SPARQL-DL的Pellet响应器12,用于本体的清晰部分。将查询传递给fuzzyDL推理机进行模糊推理。推理者允 许 对 隐 性 知 识 的 推 理 超 过 对 显 性知 识 的 推 理 。 查 询 的 格 式 是SPARQL-DL格式,使用SWRL内置程序,从模糊CB本体返回案例图17以其最简单的形式示出了通过使用SPARQL-DL语法进行语义搜索的合取查询的片段。 该查询从CB本体中为图1中的查询案例找到具有精确匹配的案例。 十六岁的情况下第10http://protege.cim3.net/cgi-bin/wiki.pl? SQWRLQueryAPI。11http://www.derivo.de/en/resources/sparql-dl-api.html。12http://clarkparsia.com/pellet/。如果找到精确匹配,则查询返回匹配病例的诊断。在没有找到精确匹配的情况下,返回整个案例以计算它们与查询案例的相似性;因为语义查询引擎不支持循环和复杂的数学计算。这个过程是在JAVA代码中处理的使用k-NN算法计算查询案例和检索案例之间的相似度,该算法根据特征类型(即,模糊的、语义的、顺序的或文本的)和全局相似性函数,诸如加权欧几里德距离函数。对于空间限制,我们将在未来的工作中提出一种新的模糊语义相似性度量,这是适合于我们提出的本体。我们的CB本体包括一个名为Has_Weight的数据类型属性,用于为每个特征分配权重El-Sappagh等人[24]在另一项工作中提出了最佳权重向量最相似案例的解决方案被检索并直接使用或输入到CBR周期的其余部分,包括案例调整、修订和保留。根据CBR方法,所提出的本体允许CBR系统将领域案例以概念的形式存储在模糊CB本体中,并根据语义和不精确性检索出最相似的案例。在糖尿病诊断中,患者往往用模糊的术语来描述自己的问题。医生依靠他们的经验,这在大多数情况下是模糊的。患者可能有一些实验室测试数值结果。一些特征值是来自SCT本体的概念ID,并且一些特征是文本。因此,本体必须支持所有这些类型的数据。我们提出的本体结构是最丰富的本体结构,它最大限度地提高了灵活性在描述病人的问题领域专家。在图15中,医生可以将数字特征输入为数字或语言标签。从列表框中选择有序特征比如说,S. El-Sappagh,M.Elmogy/Engineering Science and Technology,an International Journal 20(2017)10251037图18. 模糊语义查询的一部分。排尿频率特征的列表框具有值(正常=每天排尿3-5次,+ =每天排尿6-8次,++ =每天排尿9-10次,+++ =每天排尿10次以上)。从我们的SCT本体中选择语义特征,并计算语义相似度[36]。在案例检索中,语言标签与我们的领域专家提出的相似性矩阵进行比较。将数值模糊化,并使用模糊相似度算法计算相似度。使用精确匹配计算文本特征相似度。使用我们的领域专家提出的相似度矩阵计算普通特征可以使用距离
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功