没有合适的资源?快使用搜索试试~ 我知道了~
大数据分析对医疗保健框架的影响【Elsevier出版】Venketesh Palanisamy、Ramkumar Thiruna...
制作和主办:Elsevier沙特国王大学学报大数据分析在开发医疗保健框架中的意义Venketesh Palanisamy,Ramkumar Thirunavukarasu印度VIT大学信息技术与工程学院阿提奇莱因福奥文章历史记录:2017年9月18日收到2017年11月20日修订2017年12月7日接受2017年12月9日在线发布关键词:大数据医疗框架基础架构分析模式工具A B S T R A C T医疗保健领域受到大数据的影响,因为医疗保健组织中涉及的数据源以其数量,异构复杂性和高动态性而闻名。虽然大数据分析技术、平台和工具在各个领域都发挥了作用,但它们对医疗机构实施和提供潜在医疗应用的新用例的影响显示了有希望的研究方向。在大数据的背景下,医疗保健应用程序的成功完全取决于底层架构和适当工具的利用,这在开创性的研究尝试中得到了证明。已经进行了新颖的研究工作,用于导出特定于应用的医疗保健框架,其提供用于处理从电子健康记录到医学图像的数据源的多样化数据分析能力。在本文中,我们已经提出了各种分析途径,存在于以病人为中心的医疗保健系统从不同的利益相关者的角度来看我们还审查了各种大数据框架,包括基础数据源、分析能力和应用领域。此外,还介绍了大数据工具在医疗生态系统开发中的应用©2017作者。制作和主办:Elsevier B.V.代表沙特国王大学这是一CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.导言. 4162.大数据对医疗保健的影响4162.1.医疗保健利益相关者大数据源4172.1.1.患者4172.1.2.医生4172.1.3.医院经营者4172.1.4.制药和临床研究人员4172.1.5.医疗保险公司4183.医疗保健大数据框架4.大数据工具在开发医疗保健框架中的意义4214.1.数据集成工具4214.2.可扩展的搜索和处理工具4234.3.机器学习工具4234.4.实时和流数据处理工具4234.5.可视化数据分析工具423*通讯作者。电子邮件地址:ramkumar. vit.ac.in(R. Thirunavukarasu)。沙特国王大学负责同行审查https://doi.org/10.1016/j.jksuci.2017.12.0071319-1578/©2017作者。制作和主办:Elsevier B.V.代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.com416诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报5.结论424参考文献4241. 介绍大数据分析及其影响在许多垂直领域得到了认可,其中医疗保健系统成为有前途的行业之一(Andreu-Perez et al., 2015年)。大数据的显著特征,即数量(数据可用性的巨大性)、速度(数据的到来是一种时尚)、多样性(存在来自多种来源的具有多样化格式的 数 据 ) , 在 丰 富 的 医 疗 保 健 数 据 来源 中 找 到 了 自 己 的 特 征(Martin-Sanchez和Verspoor,2014)。用于医疗保健系统的数据源已经被广泛地分类为(i)结构化数据:遵守定义的数据类型、格式和结构的数据。医疗保健领域中的这种数据的示例包括各种疾病的分级术语、它们的症状和诊断信息、实验室结果、诸如入院历史的患者(ii)半结构化数据:以最小结构和自描述性质组织的数据。这种数据的示例包括从诸如用于有效监测患者行为的传感器的设备生成的数据(iii)非结构化数据:没有固有结构的数据,可能包括用人类语言书写的医疗处方、临床信函、生物医学文献、出院小结等。因此,探索医疗保健数据,为多元化的利益相关者(临床医生,患者,医院,药房等)提供有价值的见解由于来自各种来源的数据种类繁多(结构化、非结构化、半结构化)为了从现有的3V中提取价值(大数据属性的第四大数据显示出丰富的潜力,可支持广泛的医疗和保健功能,如临床决策支持,疾病监测和人口健康管理(Liang和Kelemen,2016)。患者电子健康记录(EHR)的快速发展,社会,行为和组学数据与基于ICT的mHealth,eHealth,Smart Health和远程医疗设备的整合,导致了新的医疗保健框架的发展,以支持精准医疗和个性化的患者护理。最近的研究尝试表明,渐进式医疗保健解决方案已经在支持各种层次的分层服务的架构框架的帮助下产生。这些框架开发背后的基本思想是对各种医疗保健数据源进行有效分析,以识别大数据源之间的因果关系和兴趣模式。这些框架促进了医疗保健解决方案从以疾病为中心的模式向以患者为中心的模式转变,从而使患者积极参与自己的医疗保健。在本文中,我们回顾了近年来在构建医疗保健框架以协调数据分析,管理和可视化技术方面发生的重大发展,作为提供改善医疗保健服务的端到端解决方案由于数据格式的多样性,以及大数据源之间存在的相关不确定性,数据管理的任务在将原始数据转化为可操作的知识方面发挥着至关重要的作用。虽然医疗数据在本质上是复杂的,但它们表现出很强的相互依赖性,因此需要完成诸如简化数据复杂性、识别在各种健康特征之间的互连的情况下,用于健康护理分析的目标属性的选择需要高度复杂和成熟的领域特定工具和技术。存在于医疗保健计算环境中的各种各样的复杂性,诸如出于患者监测的目的而处理来自无处不在的设备的面向流的数据、针对开发预测模型的不同数据源的集成此外,在数据分析生命周期的各个阶段,大多数数据丰富活动和知识综合过程在很大程度上依赖于大数据工具的使用在此基础上,系统综述了在构建医疗框架中发挥重要作用的各种大数据工具的重要特征本文的组织结构如下:第2节从不同利益相关者的角度考虑了大数据分析在医疗保健系统中的影响。第3节特意回顾了在开发医疗保健框架方面的各种最先进的研究尝试及其优缺点。第4节强调了各种大数据工具在提供医疗保健解决方案方面的意义。最后,第五部分是本文的结束语2. 大数据对医疗保健的影响在商业领域,大数据的核心价值已被有效地用于识别消费者的行为模式,以开发创新的商业服务和解决方案。 在医疗保健领域,大数据的含义服务于预测分析技术和机器学习平台(Al-Jarrah等人,2015年),以提供可持续的解决方案,如实施治疗计划和个性化医疗护理。Jee和Kim(2013)比较了医疗保健大数据与商业部门在不同属性及其价值下产生的大数据。他们将医疗大数据的特征重新定义为三个特征,即筒仓,安全性, 而不是音量、速度和多样性。Silo表示包含在利益相关者的场所(如医院)中维护的公共医疗保健信息的遗留数据库。安全特性意味着维护健康护理数据需要额外的注意。多样性特征表明医疗数据以结构化、非结构化和半结构化等多种形式存在。随着大数据分析及其相关技术的出现,从利益相关者的角度来看,医疗保健领域在不同阶段见证了务实的转变(Wang和Alexander,2015)。 大数据在医疗保健中的影响导致识别新的数据源,诸如社交媒体平台、远程信息处理、可穿戴设备等,以及对包括患者病史、诊断和临床试验数据、药物有效性指数等的遗留源的分析。当这些数据源和分析的混合物耦合在一起时,它为医疗保健研究人员提供了有价值的信息源,以实现新的医疗保健解决方案(Zhou等人, 2017年)。一个典型的以患者为中心的医疗保健生态系统及其重要的利益相关者和他们的多样化的数据源(结构化/半结构化/非结构化)在图中被感知。1.一、当这些利益相关者合作并有效地分享他们的数据见解时,诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报417Fig. 1. 以患者为中心的医疗生态系统一种具有成本效益的方式,为患者提供更好的个性化护理。通过考虑这些利益相关者在构建大数据医疗生态系统中的重要性,下一节将深入了解他们对有效利用大数据源的看法2.1. 医疗保健利益相关者大数据来源本节阐述了大数据的多样化来源如何满足主要利益相关者(患者,医生,医院运营商,制药和临床研究人员,医疗保险公司)在获得新的医疗保健解决方案方面的需求。此外,它还提供了适当的分析技术,以从指定的数据源中提取感兴趣的有意义的健康护理模式。2.1.1. 患者患者群体总是希望以可承受的成本获得广泛的医疗保健服务,并提供个性化建议(Mancini,2014)。除了医生那些无法去医院就诊的病人可以利用远程医疗服务来满足他们的医疗保健需求。该平台可以作为一个大数据存储库,捕捉体温、心率、血压等重要健康体征,并将这些数据流到一个集中存储库中,以触发定期健康警报。2.1.2. 医生从患者的诊断和治疗计划的各个阶段产生的大量数据有助于医疗保健提供以确定他们所提供的治疗进展的真正见解。医疗保健系统在执行治疗计划期间生成的大数据有许多来源。它包括各种疾病和临床服务的分类代码、实验室结果、临床记录、医学成像数据以及在不同情况下捕获患者行为的传感器设备。当这些大数据源被考虑用于构建临床疾病库(CDR)时,它可以通过有效分析疾病模式来改善公共卫生监测并提供更快的响应。此外,将来自可穿戴设备的数据集成到医疗保健应用中也提供了显著的好处,例如方便医生跟踪药物的使用,随时监测患者2.1.3. 医院运营商为了有效地管理患者利用数据科学家的专业知识开发了基于预测和预脚本分析的模型,用于测量患者满意度指数和可用服务之间的关系强度。此外,资源分配及优化技术可根据可用大数据成功部署,以满足医院不同部门的人力需求。医院的战略运营商还可以利用位置感知数据来决定各个部门的协同定位,以优化昂贵的医疗设备的使用。根据随访电话、电子邮件通信、短信产生的治疗后数据开发描述性模型也将有助于改善所提供的服务。2.1.4. 制药和临床研究人员大数据的影响反映了制药和临床研究领域的医疗改革。组学和临床大数据的使用(Wu等人,2017)有助于建立预测模型,以了解生物和药物过程,418诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报表1典型的以患者为中心的医疗保健系统中的分析途径利益攸关方大数据来源分析的性质分析技术的基础患者社区分类机器学习算法,统计建模技术,情感分析临床论坛和远程医疗平台健康文本分析文本挖掘等信息检索技术健康本体的构建基于爬虫的算法、语义分析患者网络分析基于协同过滤基因组数据库基因组序列分析关联规则挖掘与可视化技术医生电子健康记录(EHR)基于个人统计病人的个人健康纪录识别高危病人专业治疗,设计患者特定的治疗计划,提供循证指南设备生成的数据按需对患者进行实时健康分析基于机器学习算法的基于规范分析的用采样和过滤技术分析数据流医院运营商患者的电子健康记录,治疗计划住院患者住院日预测资源管理与优化回归模型和人工神经网络人力资源利用报告和利用患者优化技术,如进化算法,粒子群算法,基于用户和基于服务的协同过滤方法仪器使用日志、校准详情医疗器械故障的检测和预测。决策树归纳,贝叶斯分类器制药和临床研究人员* 查明药物的使用和购买模式关联规则挖掘,时间序列分析,离群数据挖掘临床报告、患者健康记录氨基酸序列分析、蛋白质结构预测及有效药物设计基于Hadoop和Spark医疗保险公司索赔历史值得信赖的索赔分析,索赔人口统计分析离群值分析,神经网络,遗传算法,最近邻技术人口普查和社会数据新保险计划的建议基于预测分析的算法技术物联网产生的数据减少索赔频率和严重程度这归因于获得有效药物设计的高成功率。对来自多样化大数据源的健康数据进行有效分析有助于制药公司通过较小和较短的试验来衡量设计药物的结果(Merelli et al.,2014年)。通过将内存计算技术与药品生产单位的自动化系统相结合,制药公司可以有效地集成和分析各种形式的数据,以构建端到端的产品解决方案。来自其他利益相关者的输入,例如医生对特定疾病的药物推荐、患者的消费量、药店的销售历史,使制药组织能够评估和可视化其当前的市场地位,以达成战略商业决策。2.1.5. 医疗保险公司医疗保健大数据的出现为医疗保险公司的利益开辟了新的分析途径。因此,可以以最小的保险费成本引入基于地理区域的针对频繁发生的疾病的新的健康计划。根据客户的年龄、性别、家族史、收入、工作性质等各种特征,为客户推荐合适的健康计划,使保险公司和客户都能受益。通过预测建模技术分析索赔历史中的非结构化数据,使保险组织能够预测真实索赔和异常异常值的模式,以最大限度地降低滥用成本。大数据与物联网(IoT)相结合,通过分析实时捕获的客户行为数据,促进保险公司引入新的创新业务模式,例如基于使用的保险。移动物联网(物联网)在医疗保健转型中发挥着至关重要的作用,允许新的业务模式出现,并实现工作流程的变化,提高生产力和客户体验(Dimitrov,2016)。通过分析大数据对上述人员的影响,我们确定了典型的以患者为中心的医疗保健系统中的潜在大数据源。表1列出了探索医疗保健领域中有意义的兴趣模式的各种分析策略在下一节中,我们通过强调其数据源、分析能力和应用领域来回顾各种医疗保健框架。3. 医疗保健大数据框架最近的研究尝试倡导各种医疗保健框架,用于处理来自不同数据源的大量多样化数据,以产生重要的模式和趋势。本节回顾了这些大数据框架,并强调了它们在医疗保健领域的贡献。Raghupathi和Raghupathi(2014)提出了一个使用大数据分析的医疗保健系统应用架构框架。该框架由数据源层、转换层、大数据平台层和分析层等层组成。数据源层主要集中在医疗保健的内部和外部数据源,这些数据源分布在多个位置,具有各种格式。转换层负责通过中间件和数据仓库操作等各种数据分段技术将数据提取、转换和加载到大数据平台等操作。层由各种Hadoop生态系统工具组成诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报419用于使用Map-Reduce编程模型在Hadoop分布式文件系统(HDFS)上执行特定操作。分析层执行诸如查询、报告、在线分析处理和数据挖掘技术等操作。此外,作者还概述了用于分析医疗保健大数据的各种工具和平台。虽然所提出的架构框架是医疗保健领域大数据背景下的开创性框架,但它只强调理论方面。没有实验评价的基础上提出的框架。Chawla和Davis(2013)提出了一种基于协同过滤方法的以患者为中心的个性化医疗保健框架。它捕捉病人的相似性,并为个人产生个性化的疾病风险概况。 协同过滤是一种数据分析技术,旨在根据大量用户的已知偏好来预测用户对项目或服务的意见。在所提出的框架中,根据定义的相似性约束(如职业、症状、实验室结果、家族史和人口数据),将个体患者的健康护理史与所有其他可用患者的病史进行比较。基于相似度计算,选择相似患者池并进行疾病预测。随着电子医疗记录的使用越来越多,所提出的框架在大数据的背景下提供了主动式医疗保健解决方案。除了为医生提供以患者为中心的个性化医疗保健框架以评估患者的疾病风险之外,它只处理符合ICD-9-CM(国际疾病分类,第九版,临床修改)标准的诊断代码。Kim等人(2014)尝试了利用无处不在的医疗保健系统的大数据分析框架。该框架分析从加速度计提取的生命体征,以提供医疗服务。生命体征是连续的时间序列数据,其本质上是非结构化的,并且不足以存储在传统数据库中。心电图信号(ECG)、呼吸和运动数据已被视为生命体征。该框架采用开放的标准平台来支持数据和不同设备之间的互操作性。Hadoop平台已通过添加算法进行扩展,以从生命体征的原始数据中提取特征值并将其存储用于实时分析。尽管提出了基于Hadoop的平台来提取和处理ECG等生物信号的新颖性,但他们的工作缺乏在Map-Reduce编程模型之上提供实质性的分析模型。计算方面在医疗和健康大数据信息学中的含义已经被方等人广泛调查。(2016年)。他们提出了一个名为“健康信息处理管道框架”的框架该框架由过程管道组成,例如数据捕获(识别数据源,如电子医疗保健数据、临床支持数据源和实验室结果)、存储(识别用于分析医疗保健数据的成本有效的存储基础设施)、分析(执行任务,如数据预处理、特征选择和机器学习)、搜索(从分析结果中提取有意义的感兴趣模式)、决策支持(利用模式库在健康信息学领域进行有效决策)。除了建议的框架,某些研究方向有关的问题,如结构化和非结构化的医疗保健数据,复杂性存在于现有的数据,隐私问题和可视化发现的模式也探讨了他们的工作。他们提出的医疗保健框架为大健康信息学的各个阶段提供了系统的数据处理管道,例如数据收集,存储,搜索和分析来自不同来源的数据然而,对技术方面的关注,在大数据工具和技术的帮助下实现的能力被抹杀了。随着移动设备和传感器网络的出现,普及的医疗保健服务作为健康信息学领域中的新颖解决方案而出现,因为它随时/随地向患者提供医疗保健服务。随着移动设备、传感器和可穿戴应用的广泛应用,以异构格式生成的数据已被用于提供按需医疗保健服务。Youssef(2014)提出了移动云计算环境下的医疗大数据分析框架。该框架通过以下组件在不同利益相关者(即医生、患者和药物开发人员)之间提供医疗保健数据的高级别集成、互操作性、可用性和共享:(i)云组件(ii)EHR组件-负责整合来自不同来源(如药房、医院和实验室)的不同患者记录。(iii)安全组件-通过实施加密和认证技术来保证对安全和隐私问题的保护(iv)数据分析组件-部署不同的分析工具以从可用HER发现新类型的模式(iv)护理交付组织(CDO)组件-代表分布在各个位置的不同医疗保健组织。所有这些组织都可以使用HL7协议进行数据共享,HL7协议是医疗保健组织之间通信的标准结构。尽管该框架详细讨论了在云环境中保护患者数据的安全方面,但尚未提倡对所提出的安全策略进行Lin等人(2015)关注了紧急情况下患者的自我护理服务需求,并倡导基于云的大数据医疗保健框架。它由一个离线Hadoop集群和一个在线分布式搜索集群组成。Hadoop集群负责医学文档的离线存储和索引构建,在线集群旨在以高度并发和可扩展的方式处理用户查询。在线集群包括(i)搜索节点-用于检索医疗记录(ii)用于数据分析的节点-用于开发疾病症状网格(iii)访问控制网格-用于过滤患者的隐私信息(iv)负载平衡集群-用于平衡用户查询的负载。基于所提出的框架,一个原型设计的家庭诊断服务已归因于测试的有效性,建议。此外,基于云的框架的可扩展性已经通过动态地添加和删除每个集群中的节点来实现。虽然所提出的工作实现了一个基于云的自诊断服务框架的原型,但它只分析了历史医疗记录病人。临床信息之间语义互操作性的重要性是Legaz-Garca等人开展的工作的主要焦点。(2016年)。他们认为,临床模型和临床记录之间缺乏互操作性导致医疗保健系统效率低下。为了建立电子医疗数据的语义集成,他们提出了一个基于Web本体语言的框架。从关系数据库中获得的患者数据(EHR)被转换成OWL的本体构建和构建的本体已被用于数据探索,如基于EHR的数据分类和可视化。虽然该框架提供了在生物医学研究中使用语义技术的优势,但在学习用于构建原型中的本体的最佳参数集方面的进一步努力将增强框架的结果。Sakr和Elgammal(2016)提出了一种基于网络物理系统的医疗保健框架的各种层420诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报构成该框架的主要功能是:(i)数据连接层-用于所提出的架构适用于各种用例,例如患者简档分析、人口管理、基因组分析和改进的患者监测,其中上述四种技术的集成发挥了至关重要的作用。他们的工作显著整合了各种ICT优势,如传感器技术、云计算、物联网和大数据分析,以提供智能医疗服务。另一方面,框架缺乏处理复杂数据源(如图像和流)的分析能力。Mahmud等人提出了一个基于云的环境感知框架,用于识别社会经济、人口和地理条件对公共健康的影响。(2016年)。它是一个基于Ama- zon Web服务的云平台,与地理信息系统集成,用于捕获,存储和可视化大数据。因此,已经捕获了来自各种远程位置和区域的上下文和医疗保健数据,并且已经提出了基于用于健康冲击的基于模糊规则的摘要技术的预测模型。 基于模糊规则的技术用于生成用于对健康冲击进行分类的可解释的语言规则。所提出的基于云的模型有助于医疗保健专业人员理解直接或间接引起健康冲击的社会经济、环境和文化规范的影响。从巴基斯坦农村和部落地区收集的实时数据集说明了拟议工作的新颖性。虽然本文提倡基于模糊的预测分析框架,没有足够的比较与任何基准的实验研究。Jokonya(2014)提出了一个综合大数据框架,有助于预防和控制艾滋病毒/艾滋病、结核病和矽肺等疾病。他们的框架主要集中在采矿业,创造了大量的二氧化硅粉尘。影响肺部的二氧化硅粉尘也可能导致硅肺和肺结核。当免疫系统受到艾滋病毒/艾滋病和矽肺的损害时,结核病更容易感染身体该框架解决了流行病学预测模型预测和控制上述疾病的需要。该框架的大数据部分对不同的结核病风险因素进行数据采集,并通过预测和描述模型将数据进行有效分析。虽然所提出的框架有效地执行从采矿业中发现的不同数据集的特征选择,以识别结核病(TB)疾病,该建议的新颖性尚未得到验证。已经注意到,射频识别(RFID)技术通过以有吸引力的提议执行诸如跟踪医疗设备、医院供应、药物和患者信息的任务而在医疗保健行业中受到显著关注。虽然技术影响是显著的,但它同样会引起RFID标签携带者提出的隐私问题。Rahman等人(2017)尝试基于RFID的医疗保健框架来解决隐私问题。所提出的框架由两个部分组成,即(i)Prisens -用作用于感测RFID标签以用于不同识别和监控目的的隐私保护认证协议。它包括药物使用监测、手术器械跟踪、医院人员跟踪和血液跟踪。(ii)HSAC -提供隐私保护医疗保健服务访问机制,用于在访问各种医疗保健服务时维护用户的隐私。此外,它遵循基于角色的访问机制,以限制对私有数据的未经授权的访问,非结构化临床信息。该框架也适用于较便宜的标签(计算能力较低的标签)。虽然他们的框架背后的动机是提高基于RFID的医疗保健系统中的用户的隐私,灌输不同的服务请求的不同的隐私级别的坚持将增加有前途的潜力,他们的研究工作。Sarkar(2017)提出了一种基于云的分布式健康信息系统框架,重点关注医疗信息的隐私和安全方面。建议的框架应用一组安全约束和访问控制机制,保证医疗数据的完整性,机密性和隐私性。它由各种组件组成,如电子健康记录、医疗服务组织、数据分析和最终用户。采用了一个三层敏感系统,对电子健康记录中存储的患者信息进行分类。诸如疾病名称及其状态、患者精神状态、生物特征标识符和医疗索赔编号等信息均通过Tier-0灵敏度进行确保。下一级安全性(Tier-1)已应用于验证信息,如出生日期、姓名、医生姓名等。根据Tier-2灵敏度验证邮政编码、血型、手术名称等信息。为了防止恶意黑客对患者数据的隐私和安全,该框架采用了两级安全机制(1级和2级)。因此,第一级安全涉及通过提供临时用户ID和患者ID授权用户访问医院内的患者数据。为了在医院间和医院内访问患者信息,已经实施基于OTP的第二级安全机制。虽然该框架应用了一套安全约束来维护医疗数据的隐私和机密性,但这项工作主要依赖于概念层面。因此,它需要在必要的基础设施的帮助下成功实施,以声称其有效性。嗓音病理评估(VPA)Hossain和Muhammad(2016)提出。该框架有助于从患者提取、存储、处理和分类语音信号的过程。云服务器接收来自各个医院的语音信号,并通过使用两种特征提取技术(即,MPEG-7和隔行导数模式(IDP))来处理它们。机器学习算法,如支持向量机,极端学习机,高斯混合模型被应用于分类信号为正常或病理。虽然该新框架是处理患者语音信号以构建医疗监测系统的开创性尝试,但所提出的工作没有考虑将其他大数据源集成到语音信号中以执行病理评估。Pramanik等人(2017)对医疗保健系统的最新进展进行了批判性分析,重点关注智能系统技术的使用。他们主张为大数据智能医疗保健系统建立一个概念框架,以降低成本,提高智能,提供无处不在的医疗保健解决方案。它包括诸如i)用于处理结构化、非结构化和半结构化数据源的数据源层ii)用于执行大数据密集型计算、管理和可视化的数据分析层iii)用于促进诸如消费者和服务提供商之间的数据监控、隐私和安全协议的服务的智能服务层此外,该层在设备、软件和领域实体的帮助下提供智能服务基础设施。iv)知识展示层增加了广泛的功能,例如实体需求的预测、计划和估计、健康护理服务机制的评估和建模。总体而言,该框架为医疗保健组织提供智能智能系统服务创造了机会他们的研究为大数据智能医疗保健系统提供了一个概念框架,诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报421跨学科研究方向。虽然该框架是智能代理,机器学习和文本挖掘这三个技术分支在智能健康背景下的应用,但在实施方面的结果尚未在他们的工作中进行评估。物联网(IoT)在智能健康中的使用要求医疗服务必须严格执行安全性和数据质量,以保护医疗数据的机密性和敏感性。为了在大规模异构智能健康环境中支持这一举措,Sicari et al.(2017)提出了一个灵活的政策执行框架。该框架使用策略执行点(PEP)、策略决策点(PDP)和策略管理点(PAP)来满足不同利益相关者(医生、患者和访问者)的需求。PEP负责拦截用户发布的访问资源的请求,并将其转发给PDP。PDP在收到来自PEP的请求后,根据授权策略对其进行评估,以做出决定(批准或拒绝),并通知PEP批准或拒绝的访问。授权策略的整个管理,包括运行时策略更新,都由PAP执行。包括可穿戴传感器、RFID和监视器的智能节点虽然所提出的框架提供了一个基于原型的集中式策略执行机制,以确保医疗数据的机密性,它需要进一步扩展,以支持分布式安全策略管理解决方案,以协调各种智能健康环境。Forkan等人(2015年)提出了一种基于情境感知监测技术提供个性化实时医疗保健服务的大数据框架。该框架有助于分析云环境内的大数据,以从大量数据中发现患者特定的异常。随着云的出现,已经收集了来自各种生活系统的异构上下文的连续生成的大数据,并且已经倡导了两步学习方法。在第一步中,基于Map-Reduce的Apriori算法已被应用到找出上下文属性和患者数据的生命参数的阈值之间的相关性。因此,挖掘患者特定的关联规则。在第二步中,监督学习算法,如多层感知网络,决策树,贝叶斯网络的实现上生成的关联规则执行上下文感知决策。该框架已在各种操作环境中实现,例如单一模式(在单核中执行学习算法),伪分布式模式(在Par-Par中执行学习算法)和云模式(在Amazon Elastic MapReduce中执行学习算法)。简而言之,所提出的框架利用了上下文感知计算、远程监控、云计算、机器学习和大数据的优点。作为一个基于云的大数据框架,利用机器学习方法来检测患者的异常情况,它有效地执行上下文感知决策,提供个性化的医疗保健服务。然而,还没有感知到从患者上下文生成、预处理和传输传感器数据的过程。最近,大数据分析在开发新的蛋白质结构预测问题求解受到了研究界的广泛关注。蛋白质是生物体中的关键功能单位,在人体内起激素、受体、贮存、酶、颗粒转运体等作用,并负责生物化学反应。蛋白质数据库(Protein DataBank,PDB)中蛋白质序列残基的庞大数据量、非结构化格式和不断变化的性质,促使蛋白质结构预测问题需要大数据密集型计算框架。Dencelin和Ramkumar(2016)提出了一个使用Apache Spark项目的大数据框架,该框架采用弹性分布式数据集(RDD)用于蛋白质的二级结构。该框架在分布式计算环境中使用不同的输入特征和网络参数集执行基于机器学习的多层感知器算法。输入的PDB数据集(蛋白质序列)被分为三个二级结构,即a-螺旋,b-折叠和卷曲。他们通过改变输入数据集特征和感知器参数,分析了不同参数集的分类器精度。在另一项工作中(Xavier和Thirunavukarasu,2017),他们提倡一种基于Encoder的随机森林算法,在基于Spark的分布式计算环境中对蛋白质结构进行分类。两个基准数据集,RS126和CB513被考虑到的实施和提高的精度已经获得。这两个框架提供了一个新的机会,以获得一个可扩展的,容错的,有效的和可靠的计算性能的Linux集群。当这些框架考虑基于深度学习的蛋白质结构预测算法时,他们所提出的工作的准确性结果。到目前为止,在开发各种医疗保健框架方面所讨论的广泛研究工作表明,采用基于大数据的平台和分析技术来获取优质知识并将其传播给多元化的医疗保健利益相关者非常重要。在表2中,我们根据不同的特征,如所利用的数据源、分析能力和应用领域,总结了所讨论的医疗保健框架。下一节详细阐述了各种大数据工具的含义,这些工具有助于在基于大数据的医疗保健生命周期中获得重要的人工制品。4. 大数据工具对开发医疗保健框架的影响尽管多样化的大数据框架旨在满足特定的医疗保健目标,但它们本身也适合采用标准架构指导方针来执行数据收集、预处理、数据分析、解释和可视化等活动 由于大数据医疗保健框架的特定领域性质,数据科学家等专业人员在选择适当的工具时应格外小心(PhilipChen和Zhang,2014; Sukumar等人,(2015年)将在框架设计和实施的各个层面使用。在本节中,我们将深入了解各种大数据工具的使用情况,这些工具在执行数据集成、注入智能、搜索和索引、流数据处理和数据可视化等任务中发挥着重要作用4.1. 数据集成工具医疗数据的数量和速度的持续增长以及多样化的数据类型需要利用数据集成工具的服务来聚合来自不同来源的数据。Pentaho(2017)是一个大数据分析平台,提供端到端的数据集成,支持用户分析来自不同来源的数据,如关系数据库、Hadoop分布、NoSQL存储和企业应用程序。它还提供了一个灵活的用户界面,用于创建可视化数据流,以执行数据的转换和集成。Palantir(2017)是一种数据集成工具,可快速融合来自不同来源的数据,如医疗器械输出和医疗代码。此外,它使分析技术能够开发用于跟踪程序序列和临床数据指标的模型,以管理医疗诊断。Ayata(2017)高效地带来了表2医疗大数据框架概述。作者框架名称数据源分析能力应用领域亮点03 The Dog(2014)Chawla和Davis(2013)一般概念框架。以患者为中心的个性化具有多种格式的地理上完全不同的数据电子病历,患者报告和报告。协同过滤一般医疗保健架构个性化医疗保健倡导一个基准框架,用于分析医疗保健大数据数据驱动的计算辅助,Kim等(2014)Fang等(2014)(2016年)医疗保健框架无处不在的医疗保健系统卫生信息处理经验和历史连续时间序列数据,如ECG、呼吸和SpO2电子健康记录,公共Map-Reduce编程模型特征选择和机器学习个性化医疗决策支持系统个性化医疗生命体征处理大数据平台系统数据处理管道,Youssef(2014)管道框架安全卫生信息系统健康,基因组,行为数据电子健康记录Map-Reduce算法从业者医疗保健数据的安全和隐私通用大健康信息学整合移动、云和大数据技术,Lin等人(2015年)基于云的框架,患者数据、患者资料和形式概念分析自我保健诊断医疗保健基于症状的病历Legaz-Garca等人(2016)家庭诊断服务语义网技术临床资料电子健康记录通过OWL构建本体。病人分类系统根据用户查询进行检索语义资源与第50集9.6The Fighting(2016)管理和重用临床原型的框架智能健康框架患者数据来源,例如预测建模和模式匹配根据临床标准智能数据分析电子健康记录加强医疗服务,医院信息系统,技术医疗保健应用集成传感器技术、云Mahmud等人(2016年)数据分析和放射学和实验室信息系统医疗保健数据集侧重于基于模糊规则的公共卫生服务计算和大数据分析集成云计算服务Jokonya(2014)健康冲击预测的可视化框架大数据集成框架社会经济、文化和地理条件等背景总结预测分析疾病预测和地理信息系统整体和结构化的方法,预测和控制采矿业疾病预防了解艾滋病毒/艾滋病、结核病和矽肺之间的复杂联系,Rahman等人(2017年))保护框架从RFID标签隐私保护技术安全的医疗保健服务采矿业改进基于(Sarkar,2017年基于RFID的医疗保健系统中的隐私概念框架电子健康记录提供安全约束和访问安全的医疗保健系统医疗保健系统两级分布式框架侯赛因和穆罕默德安全分布式卫生信息系统嗓音病理学评估语音信号控制机制分类技术将信号分类为安全机制基于云的大数据分析(2016年)Pramanik等人(2017)框架大数据智能化电子健康记录、诊断报告、社交媒体通过以下方式提供智能医疗保健服务正常的或病态的智能系统技术处理非结构化数据保健知识保健系统框架数据、监控数据、面向生物特征数据服务的基础设施,用于最先进的医疗保健发现机制,系统服务基础设施Sicari等人(2017)基于物联网的政策执行患者的生物参数,提供基于策略的访问控制机制智能健康应用程序到强制执行策略原语,智能健康Forkan et al.(2015)基于云的大数据个性化框架环境数据、RFID和仪器产生的数据患者档案数据、医疗记录、活动日志、生命体征和背景利用医疗资源,一种两步学习方法,包括使用防止大规模异构场景中的挖掘患者数据中的趋势和模式,医疗保健基础设施通过情境感知决策提供个性化医疗保健服务通过情境感知监测的传感器产生的环境数据关联规则挖掘后的监督学习策略以个人为中心的医疗保健方法服务Dencelin和Ramkumar(2016)基于多层感知器的蛋白质结构预测大数据框架PDB数据集基于神经网络的分类技术Drug Design Advocates a Spark based Big Data蛋白质二级结构预测框架Xavier和Thirunavukarasu大数据框架PDB数据集分布式树型包围学习药物设计倡导基于分布式火花的(2017年)基于包围盒学习的蛋白质结构预测技术具有改进的准确性的422诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报诉帕拉尼萨米河Thirunavukarasu/沙特国王大学学报423将结构化和非结构化(视频、图像、文本、声音)健康护理数据、数学模型、业务规则结合在一起,以构建预测性和规定性模型。作为数据集成软件,Attunity(2017)以高效,经济高效和可扩展的方式从不同的数据源中摄取数据。它以快速的方式集成了来自数据仓库 、 Hadoop 和 云 平 台 等 主 要 来 源 的 数 据 , 而 无 需 手 动 编 码 。Informatica(2017)提供广泛的数据管理服务,包括分析、集成和管理医疗数据,以改善患者护理。它访问并转换符合HIPAA(健康保险便携性和责任法案)和HL7标准的临床和管理数据为可用格式。Jitterbit(2017)为医疗保健组织提供了一个单一的安全平台,通过将非结构化数据与多种标准格式的结构化数据合并来访问临床和工作流数据。从专有EHR系统等来源接收的数据可以进行转换以进行综合分析。4.2. 可扩展的搜索和处理工具由于大量的临床笔记和非结构化文本通常由医生在医疗保健领域中使用,因此存在对用于执行临床数据的优化全文搜索能力的搜索和索引工具的巨大需求。这些工具用于有效的分布式文本管理和索引文件系统中的大量数据,如HDFS(Hadoop分布式文件系统)。Apache Lucene(2017)是一个可扩展的高性能索引系统,为跨不同平台的各种应用程序 Google Dre-mel(Melnik等人,2010)是用于交互式查询大型数据集的分布式系统,并且支持具有列存储表示的嵌套数据。它使用多级执行树进行查询处理。Apache Drill是Google Dremel的开源Cloudera Impala(2017)提供了对以Apache Hadoop文件格式存储的数据的高性能,低延迟SQL查询Impala与Apache Hive元存储数据库集成,以在它们之间共享数据库和表。它率先
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功