没有合适的资源?快使用搜索试试~ 我知道了~
软件X 16(2021)100892原始软件出版物BIcenter:基于反射软件方法的协作Web ETL解决方案若昂河放大图片创作者:Almeidaa,b, Cheryla,José L.奥利维拉aa葡萄牙阿威罗阿威罗大学电子、电信和信息学系b西班牙拉科鲁尼亚,拉科鲁尼亚大学信息和通信技术系ar t i cl e i nf o文章历史记录:2021年9月8日收到收到修订版,2021年11月2日接受,2021年保留字:ETL协作管道Pentaho数据集成a b st ra ct新的信息来源不断增加,导致所收集的数据空前增加。这些数据的维度和异构性需要有效的策略来搜索,访问和集成多个存储库。这一目标背后的技术通常被称为提取、转换和加载(ETL)管道,其目的是将分散的数据组织成一个通用的结构。然而,尽管这些管道很受欢迎并被广泛使用,但它们在特定场景中存在一些缺点。例如,在临床研究中,吸引多个研究人员、机构和数据集参与是很常见的,这样研究结果就可以产生更大的影响。这意味着多个实体之间的合作来设计工作流,即使这些实体由于隐私和监管问题而没有直接使用源数据的权限。此外,将管道扩展到其他数据源需要随着时间的推移添加新的概念和规则,这意味着不断更新ETL脚本。本文提出了一个协作的基于Web的ETL应用程序,允许用户设计,共享和执行ETL管道,跨多个中心。该系统由用户友好的界面支持,非技术用户可以在不需要掌握ETL细节的情况下构建ETL管道,最重要的是,无需直接访问数据。版权所有2021作者。由爱思唯尔公司出版这是CC BY-NC-ND下的开放获取文章许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。代码元数据当前代码版本1.0.1用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00169法律代码许可证MIT使用git的代码版本控制系统使用Scala和Java Play Framework的软件代码语言、工具和服务编译要求、操作环境依赖性Docker如果可用,链接到开发人员文档/手册https://bioinformatics-ua.github.io/BIcenter/book/index.html技术支持电子邮件:joao.rafael. ua.pt1. 动机和意义许多经济部门正在产生前所未有的数据量,例如,工业4.0和电子健康,通讯作者:电子,电信和信息学系 (DETI/IEETA),阿 威 罗 大学,阿威罗,葡萄牙。电子邮件地址:joao.rafael. ua.pt(João R. Almeida)。https://doi.org/10.1016/j.softx.2021.100892数据收集方面的挑战[1]。所有这些数据的潜在价值也导致人们对大数据解决方案和数据驱动的决策工具越来越感兴趣[2]。尽管已经在这一领域做出了许多努力,特别是在深度学习算法方面,但将不同数据源转换为异构和可互操作的存储库的过程仍然存在一些与数据复杂性,可扩展性,及时性和隐私策略相关的问题[3]。2352-7110/©2021作者。由爱思唯尔公司出版。这是一篇开放获取的文章,使用CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softx若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)1008922大数据通常被定义为每天产生大量的结构化或非结构化数据。这些数据量是嘈杂的,并且包含大量应该被丢弃的无效或损坏的记录[4]。这些清洁操作通常按照难以推广的特殊方法进行。另一个挑战是大量的非结构化数据,尽管这些数据包含有价值的信息,但需要进行结构化,以便使用分析方法[5]。然而,在考虑多个异构数据源时,此主题的主要挑战可能克服这些挑战可以在几个业务领域带来改进[4,5]。一些组织采用的一种战略,数据或来自外部来源是基于商业智能(BI)工具的使用[6]。商业智能是一个领域,它包含了旨在收集、准备和探索来自不同信息源的数据的应用程序和方法这些工具可以对数据进行分析探索,从而生成用于数据可视化的报告和仪表板[7]。这个概念的重点是访问和探索异构数据源,以便获得更多关于业务的信息,并做出更明智的决策[8]。目前,BI被用作覆盖数据仓库(DW)[8]领域的上位词,DW是来自异构源的数据的整合,它可以定义BI方法的基础。大多数大型和中型组织目前都采用DW系统来支持他们的BI工具[9]。然而,将数据集成和转换到数据仓库中的过程非常耗时,并且需要人工验证,与数据域无关[9该集成过程通常称为ETL(提取、转换和加载),是旨在收集原始数据并通过三个不同阶段处理它们的工作流:(1)提取,其中从异构源访问数据;(2)转换,其操纵并将加载的数据转换成期望的形式;以及(3)加载,以将结果数据存储到目标数据库中。这些操作在数据库级别处理,可以使用编程语言进行编码然而,随着这些程序的日益复杂以及在这些工作流程的设计中需要涉及多个实体,创建了更用户友好的方法[12]。其中一些方法专注于记录过程,而其他方法则专门设计为具有图形用户界面(GUI)来指定ETL工作流[13]。旨在简化ETL过程的设计和创建的最相关和最完整的工具是Talend OpenStudio ( TOS ) 和 Pentaho Data Integration ( PDI 或 Kettle )[12,13]。尽管这些工具使技术技能较少的人能够很好地理解ETL过程,但这些工具是作为基于桌面的工具开发的,这是特定需求的限制因素。在设计过程中用户协作缺乏灵活性而ETL流水线的定义对于某些应用领域是一个难题例如,在医学场景中,当临床数据需要协调到一个通用的数据模式中用于研究目的时,这需要技术团队和医学研究人员之间的合作来定义感兴趣的数据[14]。在不同的阶段都需要这种合作:(1)设计;(2)实施;(3)验证。基于桌面的工具已经在ETL领域使用多年,并且已经足以构建ETL工作流。这些工具可以具有应用程序编程接口(API)以授权其后端组件。这样的开源ETL项目的例子有可能公开开放他们的API是Pentaho,Talend和CloverETL。然而,在软件开发的其他领域,Web解决方案更有可能提供协作环境[15]。SpoonWeb是一个使用Pentaho的ETL API作为后端引擎的基于Web的图形化ETL设计器工具的示例。该工具支持PDI提供的大约一半的核心ETL组件。然而,在为这个工具维护和开发新的ETL组件方面有很大的努力。 BIcenter的目标是实现一个自反的软件架构,使ETL组件的简单和动态的表示。这个完全基于Web的平台允许技术知识较低的用户在多个机构内构建和管理ETL流程。此外,用户可以使用共享环境来协作构建ETL任务。建议的解决方案通过使用一个单一的安装,可以服务于多个用户和机构。2. 软件描述BIcenter是一个基于Web的ETL工具,它涵盖了当前在多机构环境中构建和管理ETL任务时发现的一些限制和问题。该工具简化了ETL工作流的描述,并帮助没有技术专长的用户通过直观的GUI了解此类工作流BIcenter在HTML5浏览器中复制了Kettle功能,并简化了Kettle中的一些程序,这些程序可能需要深入了解该工具的技术知识。2.1. 软件构架该系统遵循客户端-服务器模型,其体系结构考虑了四个不同的层(图1)。①的人。客户端的开发旨在提供一个响应式Web应用程序,允许构建ETL管道和配置每个单独的管道步骤。绘图功能依赖于mxGraph组件,该组件与应用程序端的服务进行通信,该服务将ETL过程的存储信息转换为mx-GraphModels。为了提供跨设备支持,该平台使用了AdminLTE,这是一个基于Bootstrap框架的完全响应式模板,可以动态调整视觉组件,以适应不同的屏幕分辨率。应用服务器使用PlayFramework开发,控制所有应用功能,维护系统业务逻辑,并提供服务层以支持客户端。该组件使用JavaPersistence API(JPA)与数据库服务器通信。MySQL数据库存储所有系统信息,包括ETL管道及其状态,即执行历史,性能指标和可能的问题。为了提取此信息并使系统与自主运行的Kettle实例通信,开发了数据集成SDK(DI SDK)此SDK包含构建和执行Kettle的ETL流程所需的方法DI SDK可以使用六个类来表示任何ETL过程类似于Kettle [16]。这些类别如下:transMeta:定义有关ETL过程的信息,并提供将这些过程保存到XML和从XML加载这些过程的方法的类。它还定义了通过添加和删除数据库、步骤、跳等组件来更改ETL过程Trans:表示与ETL流程概念相关的信息和操作。这个类可以加载、初始化、运行和监视ETL过程的执行。DatabaseMeta:为特定的数据库类型定义数据库特定的参数。StepMeta:是定义关于ETL步骤的过程的信息的类。transHopMeta:定义ETL过程中两个步骤之间的链接·····若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)1008923图1.一、 系统架构有4个主要组件:客户端;应用服务器;数据库服务器;和Kettle服务器。图二. 在 B I c e n t e r 中 实 现 ETL管道, 以处理从合成气象站收集的数据集。BaseStep:表示与ETL步骤的过程相关的信息和操作。该类包含初始化、行处理和步骤清理的方法。2.2. 软件功能BIcenter包含了为ETL管道设计的最流行的解决方案中可用的常见功能,主要是因为它构建在Kettle实例之上然而,开发该系统在本节中,我们将重点介绍BIcenter的一些主要特性。2.2.1. ETL任务编辑器演示ETL解决方案操作的一个常见但简单的用例是处理从气象站检索的数据。因此,我们使用了一个降雨数据集来演示该工具中的基本ETL功能。在BIcenter上实现的ETL管道如图所示。2,而这条管道的目标是按月和年统计雨天的数量此管道中提供的ETL步骤是在 WEB界面。图3表示定义ETL步骤以按行过滤数据的接口。此组件允许在过滤器中应用条件的定义,并将符合条件的信息作为true返回到设计为“按日期排序”的步骤不符合此条件的数据是回到了“阳光灿烂的日子”这一在定义ETL管道之后,可以运行它并分析执行历史。此历史记录提供有关每个执行状态以及每个管道的步骤。此外,还可以检查管道的性能指标,并按每个组件进行详细说明。在图4中,示出了针对图1中定义的流水线的这些度量。 二、2.2.2. 流水线执行BIcenter可以在本地数据库或私有和远程服务器中执行ETL管道,而无需新的本地安装。这些数据库或远程服务器的连接细节与每个机构相关联,并且这些连接的访问受到控制。当直接连接到本地数据库时,需要在系统通过一个表单生成BIcenter和数据库之间的连接链接。然后使用定义的数据库执行ETL管道。私有服务器和远程服务器具有不同的行为。这些服务器旨在确保在处理敏感数据时的数据保护和隔离。因此,它是使用Carte开发的,Carte是Kettle上提供的轻量级HTTP服务器,允许远程和并行执行ETL任务。BIcenter可以向运行Carte的服务器执行经过身份验证的请求。这些请求包含要执行的ETL任务的定义Carte还包含集群特性,使单个转换能够被划分并由运行Carte服务器的多台BIcenter包含机制来简化发送命令的过程,以控制Carte从服务器上转换的部署、管理和监视·若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)1008924图三. 过滤器组件的BIcenter接口。见图4。 运行气象站ETL管道后显示性能指标的BIcenter界面。2.2.3. ETL任务可扩展性尽管Kettle已经包含了一组ETL操作,但总有一些特定的场景可能需要实现新的组件。BIcenter默认部署包含Kettle中最常用的ETL组件然而,开发该系统的目的是支持添加新任务,而不需要开发广告代码,即。,如果在Kettle实例上开发了新任务}的情况下,{“label“:“CaseSensitiveCommpare?“,“method“:“setCaseSensive“}]}]}BIcenter可以通过它的定义来识别它。这些定义都保存在JSON文件中,在应用程序启动期间自动处理。例如,在代码片段1中, 我们展示了在BIcenter实例上添加Sortbox任务的JSON配置。{“name“:“SortRows“,“label“:“SortRows“,“componentPropertiess“:[{代码 片段 一曰:JSON配置来指定Sortbox组件。使用此格式定义新的ETL任务需要组件属性和元数据。此设置过程应由具有Kettle任务扎实知识的实体执行但是,在系统中定义新组件后,非技术用户可以在Web界面中使用该组件“label“:“StepName“,“shortName“:“StStepName“,“type“:“input“}的情况下,{“label“:“Fields“,“type“:“table“,“componentMetadatas“:[{“label“:“FieldName“,“method“:“setFieldName“,“type“:“select“,“source“:“inputFields“}的情况下,{“label“:“Ascending“,“method“:“setAscending“若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)10089252.2.4. 多机构访问控制用户可以在应用程序中担任不同的角色,也可以属于不同的机构。因此,引入了基于规则的访问控制(RBAC)机制,其中每个角色维护一组权限。这些权限包括操作与资源的关联。身份验证实体是给定用户组的外观,可以使用轻量级目录访问协议(LDAP)或活动目录(AD)服务。当用户访问平台时,底层用户组 通过尝试在每个已配置的用户组上进行身份验证来确定。如果身份验证成功,则可以在数据库中实例化用户。根据用户所属的组,他们可以获得相应的角色和机构访问权限。访问和管理ETL任务和机构的机制可以分为四种不同类型的用户:若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)1008926administrator:负责管理平台的实体。此角色包含创建和删除机构以及管理与机构关联的所有功能的权限。资源管理器:能够管理私有数据源和执行服务器的实体。此角色有权在特定机构内创建和删除私有数据源和执行任务管理器:该实体可以构建和执行ETL任务,并且能够访问ETL任务编辑器以在特定机构内创建数据分析师:这是最有限的角色,可以检查任务执行历史,即结果数据,执行日志和性能指标。2.2.5. 协作环境ETL任务编辑器是可以设计和定义ETL管道的工作区。每个管道都是为一个特定的机构,被包含在一个封闭的环境中。因此,在一个实例中具有任务管理器角色的用户可以同时在同一个ETL管道中工作。BIcenter不创建实时工作会话,而是提供了一个环境,在这个环境中,多个用户可以为ETL过程的构建做出贡献。此功能的目标是允许用户访问最新的ETL管道,而无需任何额外的同步过程。3. 说明性实例该应用程序的主要功能是提供一个协作和私有环境,其中包含一组能够创建ETL管道的组件。在本节中,我们将重点介绍两个场景:(1)一个实际场景,它受益于远程执行;(2)一个用例,它需要多个实体之间的协作来定义和运行ETL管道。3.1. 来自质谱的生物标志物质谱法是一种物理分析技术,通过测量一个或多个分子的质荷比来检测和鉴定感兴趣的分子。这些测量可用于确定sam的精确分子量。简单的组件[17]。该程序允许通过分析样品中存在的生物标志物来鉴定感兴趣的分子。在实践中,这需要将一组试管放置在平板中,以便在实验室中进行筛选。然而,为了微调数据机器,需要定期计算生物标志物这种情况下的数据在机构的设施中受到保护图5示出了该流水线的实现。在第一个任务中,按日期过滤微孔板。该过滤器的输出结果与筛选值合并然后,使用几个ETL步骤,计算所选生物标志物的值的平均值最后一个任务将此信息写入数据库表。这个管道很容易在Web浏览器中定义,并在私有服务器中远程执行。3.2. 卫生数据库上一个示例的目标是展示一个用例,协作特性对于优化ETL设计和验证至关重要的用例。OHDSI(Observational Health Data Sciences and Informatics)1是一个国际组织,旨在开发支持大规模健康护理数据。该组织是作为OMOP(观察性医学成果伙伴关系)项目的成果而发起的,旨在继续开展全球观察性研究。如果相关机构创建了一个观察数据库,其中包含存储在电子健康记录(EHR)系统中的数据,并将其迁移到设计为OMOP CDM(通用数据模型)的通用数据模式中,则这些研究是可能的[18]。目前迁移数据库的战略利用了在国际人道主义发展和社会调查框架内开发的三个工具这些工具用于数据所有者和OHDSI生态系统中的专业人员之间的会议,以记录有关ETL管道的指导方针。这些工具的输出被技术团队用作使用编程语言实现ETL代码的要求。虽然这种策略在这种情况下是有效的,但是当目标数据库需要更新时,它是耗时的并且不是很灵活。BIcenter协作环境简化了ETL过程设计期间这些团队的参与所涉及的实体使用图形界面定义必要的任务,将EHR数据迁移到OMOP CDM数据库中,最终减少了技术团队的支持,而无需实施ETL代码。另一个积极的方面是ETL管道的简化维护,即这些管道需要不时地执行,以保持观测数据库的更新。然而,可能需要进行一些新的调整,以纳入源数据库中可能出现的新变化,例如,尚未映射其标准定义的新药。通过这个基于Web的协作工具,可以远程控制此更新和执行。4. 影响许多软件应用程序旨在执行ETL工作流。虽然其中一些目前正在复杂的场景中使用,但它们在协作环境中缺乏灵活性。BI-center旨在通过提供与成熟的ETL工具类似的功能来填补这些空白,例如,水壶以及协作环境是开发此应用程序的核心要求,允许在团队中定义和共享相同的工作流,并允许在多个机构中执行管道。将卫生数据统一到一个共同的数据模式中是可以从这种方法中受益的一种情况。目前,一些举措旨在重新使用健康数据来执行分析临床研究中的数据[14]。其中一些举措包括建立一个由几个机构组成的数据库网络[19]。这需要一个通用的数据模式,并且源数据需要在ETL工作流中进行处理。但是,数据所有者并不知道目标数据模式,也不知道如何把他们的数据库映射到这个模式上另一方面,专门研究目标数据模式的团队通常不知道源数据,也不知道如何将医学概念映射到标准定义上。目前针对这个问题的解决方案不灵活,并且不提供协作环境。BIcenter提供的协作环境可以解决这种和类似场景中的团队合作问题。我们使用BIcenter在一个时间表和受保护的环境。此示例描述1http://www.ohdsi.org/····若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)1008927图五、 用于计算生物标志物平均值的ETL管道。在以前的工作[20]中,我们提出了一种方法,旨在将不同的队列协调成一个标准的数据模式。该模式基于OHDSI通用数据模型,用于阿尔茨海默然而,考虑到它是为了特殊需要而用Python开发的,它需要技术支持来应对每一个新的需求。为了避免这种依赖,我们将核心引擎迁移到BIcenter,以获得相同的协调管道,使用其Web任务编辑器。通过这种方式,我们希望最终用户能够轻松构建和管理自己的数据转换过程。相同的策略用于升级药物注释器管道,该管道识别临床笔记中的药物提及并将其导出到OMOP CDM数据库[21]。开发BIcenter不仅是为了取代目前用于ETL工作流的工具,而且是为了使用基于Web的方法扩展解决方案的多样性。为了保持与现有工具的兼容性,它利用Kettle特性在本地管理ETL过程,而不是构建新的核心。尽管有一个协作环境,BIcenter还允许远程执行和定义ETL工作流,而无需访问源和目标服务器。此策略简化了ETL工作流的管理,并且实现中使用的策略为访问私有服务器提供了一层安全性。这些功能简化了负责处理数据的IT团队的任务该软件现在作为开源软件发布,但是,它可以在商业环境中作为支持工具使用。目前,在欧洲的一个项目中有一项倡议,鼓励卫生机构采用前面提到的共同数据模型。在这个项目中,一些中小型企业(SME)接受了培训,以帮助这些机构将其数据迁移到这个新模式中。BIcenter可能是这项任务的一个很好的资产,它支持ETL过程的所有阶段。5. 结论我们提出了BIcenter,一个基于Web的ETL解决方案,它复制了Kettle API中可用的组件,使用JSON中的元数据描述,以及使用Java反射的反射方法以这种方式,可以在没有任何进一步编码的情况下执行新组件的添加。开发它的主要目标是创建一个协作和易于使用的ETL管道环境,而不会丢失桌面工具中已经存在的功能。最终产品提供了一个简单易用的工作区来构建和运行ETL流程,而无需执行新的系统部署。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作确认这项工作得到了欧盟/EFPIA创新药物倡议2联合承诺的支持J. R.A.该项目由葡萄牙国家科学基金会(FCT)资助,资助号为SFRH/BD/147837/2019。引用[1]Khan M,Wu X,Xu X,Dou W. 大数据在工业4.0炒作中的挑战和机遇。2017 年 IEEE 国 际 通 信 会 议 。 IEEE;2017 年 , 第 1-6 页 。http://dx.doi.org/10.1109/ICC.2017的网站。7996801[2]Zhuang Y,Wu F,Chen C,Pan Y. 挑战与机遇:从大数据到AI 2.0中的知识前沿信息技术电子工程2017;18(1):3-14.http://dx.doi.org/10.1631/FITEE.1601883网站。[3]Vassakis K,Petrakis E,Kopanakis I.大数据分析:应用、前景和挑战在:移动大数据. Springer; 2018,p. 3-20. http://dx.doi.org/10.1007/978-3-319-67925-9_1网站。[4]Zicari RV.大数据:挑战与机遇。大数据计算2014;564:103.[5]Bhadani AK,Jothimani D.大数据:挑战、机遇和现实。In:有效的大数据管理和实施机会。IGI Global; 2016,p. 1-24. http://dx.doi.org/10.4018/978-1-5225-0182-4的网站。ch001。[6]Rikhardsson P,Yigitbasioglu O.人工智能会计研究中的商业智能分析:现状和未来焦点。IntJAccountInfSyst2018;29:37-58.http://dx.doi.org/10.1016/j.accinf.2018.03.001网站。[7] 郑 建 国 。 商 业 智 能 的 数 据 可 视 化 。 Glob Bus Intell 2017;67-82.http://dx.doi.org/10.4324/9781315471136-6网站。[8] Mariani M,Baggio R,Fuchs M,Höepken W.酒店和旅游业的商业智能和 大 数 据 : 系 统 性 文 献 综 述 。 IntJ Contemp Hosp Manag 2018.http://dx.doi.org/10.1108/IJCHM-07-2017-0461.[9] 作者:Chandra P.数据仓库研究综述。Int J Inf Technol 2018;10(2):217-24. http://dx.doi.org/10.1007/s41870-017-0067-y.[10] 阿里河实时大数据仓库和分析框架。2018 IEEE第三届大数据分析国际会议IEEE; 2018 , p.43 比 9 http://dx.doi.org/10.1109/ICBDA.2018.8367649 网站。若昂河 Almeida,Leonardo Coelho and José L. Oliveira软件X 16(2021)1008928[11]Hassan MK,El Desouky AI,Elghamrawy SM,Sarhan AM.大数据在医疗信息化和智能医院中的挑战和机遇。 智慧城市的安全:模型、应用和挑战Springer; 2019,p. 3-26. http://dx.doi.org/10.1007/978-3-030-01560-2_1网站。[12]Biswas N,Sarkar A,Mondal KC.高效增量加载在用于实时数据集成 的 ETL 处 理 。 InnovSystSoftwEng2020;16 ( 1 ) : 53-61.http://dx.doi.org/10.1007/s11334-019-00344-4网站。[13]Kherdekar VA , Metkewar PS. ETL 工 具 的 技 术 综 述。 Int J Appl Eng Res2016;11 ( 4 ) : 2557-9. http://dx.doi.org/10.37622/IJAER/11.4.2016.2557-2559。[14]Hripcsak G,Ryan PB,Duke JD,Shah NH,Park RW,Huser V,等.使用OHDSI网络大规模表征治疗途径。Proc Natl Acad Sci 2016;113(27):7329-36. http://dx.doi.org/10.1073/pnas.1510502113网站。[15] Maróti M,Kereskényi R,Proskés T,Völgyesi P,Lédeczi A.设计复杂计 算 系 统 的 在 线 协 作 环 境 . Procedia Comput Sci 2014;29 : 2432-41.http://dx.doi.org/10.1016/j.procs的网站。2014.05.227。[16]Casters M , Bouman R , Van Dongen J. Pentaho kettle solutions :Buildingopen source ETL solutions with pentaho data integration. JohnWiley&Sons;2010.[17]Wang M,Jarmusch AK,Vargas F,Aksenov AA,Gauglitz JM,WeldonK,等人,Mass spectrometry searches using MASST. Nature Biotechnol2020;38(1):23-6. http://dx.doi.org/10.1038/s41587-019-0375-9网站。[18]Hripcsak G,Duke JD,Shah NH,Reich CG,Huser V,Schuemie MJ等人,观察健康数据科学和信息学(OHDSI):观察研究人员的机会。StudHealth Technol Inf 2015;216:574. 网址://dx.doi.org/10.3233/978-1-61499-564-7-574网站。[19]Almeida JR,Fajarda O,Pereira A,Oliveira JL.从分布式数据库访问患者临床数据的策略。在:HEALTHINF.2019,p.466-73。http://dx.doi.org/10.5220/0007576104660473网站。[20]奥拉斐尔阿尔梅达J,奥席尔瓦LB,博斯I,维瑟PJ,奥利维拉JL。多中心临床研 究 中 队 列 协 调 的 方 法 。 Inf Med Unlocked 2021;27 : 100760.http://dx.doi.org/10.1016/j.imu.2021.100760网站。[21]Almeida JaR,Silva JaF,Matos S,Oliveira JL.两阶段工作流程,从临床记录中提取药物提及并将其协调到观察性数据库中。J Biomed Inform 2021;120:103849. http://dx.doi.org/10.1016/j的网站。jbi.2021.103849。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 十种常见电感线圈电感量计算公式详解
- 军用车辆:CAN总线的集成与优势
- CAN总线在汽车智能换档系统中的作用与实现
- CAN总线数据超载问题及解决策略
- 汽车车身系统CAN总线设计与应用
- SAP企业需求深度剖析:财务会计与供应链的关键流程与改进策略
- CAN总线在发动机电控系统中的通信设计实践
- Spring与iBATIS整合:快速开发与比较分析
- CAN总线驱动的整车管理系统硬件设计详解
- CAN总线通讯智能节点设计与实现
- DSP实现电动汽车CAN总线通讯技术
- CAN协议网关设计:自动位速率检测与互连
- Xcode免证书调试iPad程序开发指南
- 分布式数据库查询优化算法探讨
- Win7安装VC++6.0完全指南:解决兼容性与Office冲突
- MFC实现学生信息管理系统:登录与数据库操作
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功