书书书
收稿日期:20181122;修回日期:20190104 基金项目:国家自然科学基金重大研究计划资助项目(91646205)
作者简介:徐博艺(1966),男(通信作者),山东莱州人 ,副教授,硕导,博士,主要研究方向为信息管理与信息系统、电子商务、人工智能研究
(byxu@sjtu.edu.cn);金初阳(1993),男,浙江宁波人,硕士,主要研究方向为知识图谱;胡代平(1967),男,四川人,副教授,硕导,博士,主要研究
方向为信息系统与决策支持、神经网络、数据分析与挖掘;张鹏翥(1962),男,江苏人,教授,博导,博士,主要研究方向为信息管理与信息系统、健
康管理、群决策支持、大数据分析;蔡鸿明(1975),男,贵州盘洲人,研究员,博导,博士,主要研究方向为语义网技术、信息系统建模.
医联网应用中异源健康数据语义融合方法研究
徐博艺
1
,金初阳
2
,胡代平
1
,张鹏翥
1
,蔡鸿明
2
(1.上海交通大学 安泰经济与管理学院,上海 200233;2.上海交通大学 软件学院,上海 200240)
摘 要:医疗物联网及移动医疗应用中多种传感器采集的生命体征数据,以及各类健康医疗数据彼此之间存在
语义异构性,导致智能医疗物联设备数据融合困难。针对这一问题,研究了基于开放关联数据的语义消歧方法。
首先对设备数据进行本体建模,形成局部本体;然后利用图匹配算法将局部本体与开放医疗关联数据进行概念
对齐,间接消除异源数据间的语义异构性;最后,在运动手环与体重计数据融合实验中,通过与开放关联数据源
的关联匹配判定血压和体重等异构概念属于语义相关概念。实验结果表明,通过与开放关联数据源关联,可以
实现局部本体语义扩展,进一步实现异源医联网设备数据融合。
关键词:开放关联数据;移动健康;语义建模;物联网;概念对齐
中图分类号:TP391 文献标志码:A 文章编号:10013695(2020)07029206305
doi:10.19734/j.issn.10013695.2018.11.0949
Heterogeneoushealthcaredatasemanticfusionmethodfor
medicalIoTapplication
XuBoyi
1
,JinChuyang
2
,HuDaiping
1
,ZhangPengzhu
1
,CaiHongming
2
(1.AntaiCollegeofEconomics&Management,ShanghaiJiaoTongUniversity,Shanghai200233,China;2.SchoolofSoftware,Shanghai
JiaoTongUniversity,Shanghai200240,China)
Abstract:SemanticheterogeneityexistsinphysiologicalindexdatacollectedbyvarioussensorsinmedicalInternetofThings
andmobilemedicalapplications
,aswellasindifferentkindsofhealthcare/medicaldata.Thisleadstodifficultyofdatafusion
forsmartmedicalIoTdevices.Inordertosolvethisproblem,thispaperdevelopedsemanticdisambiguationmethodbasedon
openlinkeddata.First,themethodmodeleddevicedatatofromlocalontology.Thenitusedgraphmatchingalgorithmtoalign
conceptsbetweenlocalontologyandopenmedicaldatasourcetoindirectlyeliminatesemanticheterogeneityofmultisourceda
ta.Finally
,bylinkingandmatchingtoopenlinkeddatasources,theexperimentofdatafusionbetweensportsbraceletsandin
telligentweightmeterequipmentdeterminethatheterogeneousconcepts,suchasbloodpressureandweight,aresemanticrela
tedconcepts.Theresultsshowthatlinkingtoopendatasourcesmayrealizesemanticextensionoflocalontology,andthenrea
lizedatafusionofheterogeneousmedicalIoTdevices.
Keywords:openlinkeddata;mhealth;semanticmodeling;InternetofThings(IoT);conceptalignment
0 引言
信息技术在医疗领域的广泛应用带来了海量的健康医疗
数据
[1,2]
。来 自 医 院 信 息 系 统 (hospitalinformationsystems,
HIS)的电子病例、各种智能健康设备收集的生命体征信息以
及社交网络等 Web资源潜在的人口健康信息等,形成健康医
疗大数据应用环境。健康大数据是国家重要的基础性战略资
源,有效利用该数据对满足居民个人健康管理需求,提高区域
公共卫生管理水平,改善药物副作用评估、辅助诊断与个性化
治疗等方面具有重要价值
[3,4]
。
在健康 医 疗 大 数 据 应 用 中,异 构 数 据 融 合 是 关 键 环
节
[5,6]
。不同医疗健康数据源间数据存在格式异构性,以及同
名不同义、同义不同名、不同名不同义替代药品等语义异构性
问题。尤其,随着物联网、移动计算等信息技术在医疗领域的
广泛应用,物联网、云计算与大数据处理技术构成以“感、知、
行”为核心的智能疾病监控与护理体系,智慧医疗与移动医疗
多网融合导致多种传感器实时跟踪产生的生命体征数据以及
不同医疗主体间诊疗数据存在较强的语义异构性,加剧了健康
数据融合困难,成为健康大数据应用的一个巨大挑战
[7,8]
。
针对格式异构性问题,通过统一数据标准或中间件技术,
例如 SOA架 构
[9]
、HealthLevel7(HL7)、可 扩 展 标 记 语 言
(XML)、DICOM 标准和工作流技术,可以有效实现异构医疗信
息系统集成以及不同数据格式的诊疗数据源互操作。其中,医
疗信息共享标准
HL7定义了医疗保健机构间传输和交换临床
数据提供统一信息模型,从格式层对诊疗数据进行异构整合,
通过规范化的名称和唯一编码消除医疗活动间术语歧义,受到
广泛应用
[10]
。为了支持医疗设备数据交换,ISO/IEEE11073、
IHEPCD01和 HL7FHIR标准相继成为诊疗设备与医院信息
系统间数据共享的主要实现技术
[11]
。临床数据中心(CDC)则
被认为是在 HL7等行业数据标准之上构建数据交换平台,解
决数据格式异构性,实现诊疗数据整合与集中展示的代表性方
法之一
[12]
。2006年启动的医联工程是利用 CDC中心方法实
现跨部门、跨区域健康数据共享的典型应用,受到卫生主管部
门的重视
[13]
。医联工程主要实现医院间临床信息,包括检查
检验结果、门诊处方、住院病案首页、部分医学影像资料等交换
第 37卷第 7期
2020年 7月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol37No7
Jul.2020