没有合适的资源?快使用搜索试试~ 我知道了~
技术数据使用本体简化对人类生物医学数据集的图形摘要亮点d生物医学的进步取决于敏感的人类数据d数据使用本体论为同意的数据使用提供术语和定义数据使用本体促进了数据集的d全世界超过20万个数据集已使用数据使用本体加以注释。作者作者:Jonathan Lawson,Moran N.卡比利,吉赛尔·克里,...,海梅·M作者:Guidry Auvil,TommiH. Nyronen,Me'lanieCourtot对应mcourtot@gmail.com简言之GA4GH数据使用本体(DUO)为同意书及其代表的数据共享政策提供了明确的机器可读标准语言。Lawson等人描述了DUO标准和在整个数据访问工作流中的实现,以加快数据访问,同时维护或改进合规流程。劳森等人,2021,细胞基因组学1,100028十一月10,2021 <$2021作者. https://doi.org/10.1016/j.xgen.2021.100028会会开放获取技术数据使用Ontology进行精简负责任地获取人类生物医学数据集乔纳森·劳森,1.37莫兰N。卡比利,1.37吉赛尔克里,2蒂凡尼鲍特伍德,3阿德里安索罗古德,4.5皮纳尔阿尔珀,5萨里昂R。鲍尔斯,6丽贝卡R。博伊尔斯,7安东尼J布鲁克斯,8马修刷,9托尼伯德特,2海莉克里塞尔,6斯泰西唐纳利,1斯蒂芬妮O.M.戴克,10马洛里A。Freeberg,2Melissa A. Haendel,9Chihiro Hata,11Petr Holub,12FrancisJeanson,13Aina Jene,14Minae Kawashima,15Shuichi Kawashima,16Melissa Konopko,17Irene Kyomugisha,18Haoyuan Li,19Mikael Linden,20Laura Lyman Rodriguez,21Mizuki Morita,22Nicola Mulder,23Jean Muller,24,25(作者名单见下页)1美国马萨诸塞州剑桥市哈佛大学和麻省理工学院布罗德研究所2英国欣克斯顿市欧洲分子生物学实验室-欧洲生物信息学研究所(EMBL-EBI)3澳大利亚维多利亚州帕克维尔市默多克儿童研究所澳大利亚基因组学4加拿大魁北克蒙特利尔麦吉尔大学人类遗传学系基因组学和政策中心5ELIXIR-Luxembourg,Luxembourg Centre for Systems Biomedicine,University of Luxembourg,Belvaux,Luxembourg6Wellcome Sanger Institute,Wellcome Genome Campus,Hinxton,UK7RTI International,Research Triangle Park,NC,美国8莱斯特大学,英国9科罗拉多大学安舒茨医学院,美国10麦吉尔综合神经科学中心,蒙特利尔神经学研究所,医学院神经病学神经外科系加拿大蒙特利尔麦吉尔大学11日本三岛国立遗传学研究所生物信息和DDBJ中心12BBMRI-ERIC,AT and Masaryk University,Brno,Czech Republic13University Health Network,加拿大14CentredeRegulacio'Geno'mica(CRG),巴塞罗那,西班牙15日本科学技术厅国家生物科学数据库中心,日本16生命科学数据库中心、数据科学研究联合支援中心、信息系统研究机构、日本柏市(联系方式见下页)总结人类生物医学数据集对于研究和临床研究至关重要,以造福人类健康,也往往包含个人参与者的敏感或潜在识别信息。因此,在处理和提供这些数据时必须谨慎,以遵守道德和监管框架以及知情同意数据条件。为了实现和简化这些生物医学数据集的数据访问,全球基因组学与健康联盟(GA4GH)数据使用和研究人员身份(DURI)工作流程开发并批准了数据使用本体(DUO)标准。DUO是人类和机器可读数据使用术语的分层词汇表,一致且明确地表示数据集DUO已由主要的国际利益相关者实施,如布罗德和桑格研究所,目前用于全球20多万个数据集的注释在数据管理和访问中使用DUODUO注释增加了数据集的公平性,并在整合次要分析数据时使用通用数据使用配置文件支持数据链接。DUO使用Web Ontology Language(OWL)实现,为了提高社区意识和参与度,DUO托管在一个开放的集中式GitHub存储库中。DUO与GA4GH护照标准一起,提供了一个新的,高效的,简化的数据授权和访问框架,使全球生物医学数据集的共享增加。介绍为了应对健康领域的全球科学挑战,人类生物医学数据必须在全球范围内共享和整合1为了促进发现和改善医疗保健,研究人员和临床医生需要能够查找、访问、协调和重用来自不同数据源的数据。用于研究的数据访问通常由数据存储库提供便利,并且在越来越多的联合数据环境2中,联合数据环境2将数据集内部或相互聚合,并将结果提供给CellGenomics 1,100028,November 10,2021 <$2021作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取技术2细胞基因组学1,100028,2021Satoshi Nagaie,26Jamal Nasir,27Soichi Ogishima,26Vivian Ota Wang,28Laura D。Paglione,29Ravi N.潘迪亚,30海伦帕金森,2安东尼A。Philippakis,1Fabian Prasser,31Jordi Rambla,14Kathy Reinold,1Gregory A.拉什顿,1安德烈萨尔茨曼,1加里桑德斯,17海蒂J索非亚,32约翰D。Spalding,2Morris A. Swertz,33岁IliaTulchinsky,34岁埃丝特·J 范恩克沃特,33苏希尔·瓦尔马,35克雷格·沃辛,34山本夏子,36山崎千人,36林登·扎斯,23海梅·M。古德里·奥维尔,28岁,托米·H。Nyroenen,20岁,Me'lanieCourtot,2,38岁,*17ELIXIR Hub,Wellcome Genome Campus,Hinxton,UK18南非开普敦开普敦大学健康科学学院人类遗传学系19加拿大20ELIXIR-Finland,CSC - IT Center for Science Ltd,Espoo,Finland21Patient-Centered Outcomes Research Institute,Washington,DC,USA22 Okayama University,Okayama,Japan23计算生物学部,IDM,健康科学学院,开普敦大学,南非开普敦24Atriatoire de Ge 'ne' tique Me 'dicale,Institut de Ge' ne 'tique Me' dicale25AlsaceGe′ne′tiqueMe′dicale26日本仙台东北大学东北医疗大银行组织(ToMMo)27英国北安普顿大学生命科学系28美国马里兰州罗克维尔国家卫生研究院国家癌症研究所数据共享办公室29美国纽约州雷戈公园球形奶牛研究组1137430Microsoft Research,Redmond,WA 98052,USA31柏林卫生研究所,Charite '-Universitaütsmedizin Berlin,德国32国家人类基因组研究所,NIH,Bethesda,MD,美国33基因组学协调中心,遗传学系,格罗宁根大学,格罗宁根大学医学中心,荷兰格罗宁根34Google Cloud,Kitchener,ON N2H 5G5,Canada35Health Data Research UK,Gibbs Building,215 Euston Road,London NW1 2BE,UK36大坂大学,大坂,日本37这些作者贡献相等38主要联系人* 通讯地址:https://doi.org/10.1016/j.xgen.2021.100028mcourtot@gmail.com研究社区。在数据集的聚合中出现了挑战,这些数据集在数据重用方面具有不同的伦理或法规条件。不同的条件可能源于不同的适用数据保护法律(例如,对允许的处理目的的限制,向第三国的转移),知情同意(例如,具体与宽泛)、政策(例如,IRB数据发布授权)或数据共享协议(例如,集团内)。3由于重复使用条件的这种异质性,研究人员可能难以搜索和找到适当的数据集,请求和访问这些数据集的方法各不相同,并且一旦获得批准,对数据的允许使用和/或下游分析没有共同的理解。目前访问敏感的人类生物医学数据的过程可能是繁琐的,时间和成本密集型的,并且在存储库之间可变。在典型的工作流程中,数据访问委员会(DAC)手动审查数据使用术语;由于需要解释通常以不一致和模糊的语言描述的数据使用术语,该过程可能被延迟。 DAC之间的访问权限确定也可能存在不一致性,特别是对于定义广泛的数据使用术语,例如“允许用于疾病和相关疾病”。类似地,DAC对禁止"商业使用"的同意书中的语言有不同的解释,从不允许商业组织访问数据到不允许将数据用于商业目的-与组织类型无关。最后,这些解释可能会随着时间的推移而发生变化,从而增加了数据使用方式无法反映研究参与者最初商定并导致不一致的数据共享做法。为了满足对术语一致性和对允许数据使用的可靠解释的需求,GA4GH数据使用和研究人员身份(DURI)工作流4开发了一个数据授权和访问框架,以简化研究人员根据其证书和研究目的访问生物医学数据集的过程。该框架的一个主要组成部分是数据使用本体(DUO),这是一个标准的、机器可读的数据使用术语词汇表,可以在数据使用条件和预期研究用途之间进行直接匹配。DUO由GA 4GH护照标准(参见本期的Voisin等人)5补充,该标准提供了一种机器可读的re-employer数据访问权限表示GA4GH DUO和Passport标准共同支持研究人员根据其身份验证和授权级别自动访问多个数据集,并已被GA4GH DURI工作流的各种组织成员部署。DUO现在是公认的GA4GH数据使用术语标 准 , 基 于 几 个 GA4GH 驱 动 程 序 项 目 的 用 例 。 6AustralianGenomics、EGA、GEnome Medical alliance(GEM)Japan、Human Heredity Health in Africa(H3 Africa)、U.S. NationalHeart , Lung , and Blood Institute 、 BBMRI-ERIC 和 U.S.National Cancer Institute均对DUO术语的制定和审查做出了贡献,DUO术语与数据使用术语或其各自同意书的措辞保持一致。全球超过200,000个数据集已使用细胞基因组学1,100028,2021年11月10日3澳大利亚基因组学14技术会开放获取表1.截至2021年2月,数据保管人使用DUO注释的数据集计数使用DUO标注的数据集桑格研究所700HDRUK 568简单数据集使用同意书中最常使用或引用术语,包括数据共享条款。DUO并不旨在表示所有可能的数据使用术语、同意短语或权限、限制或要求的复杂逻辑排列。从结构上讲,DUO包含25个术语,代表两种类型的数据使用术语,即许可和修饰语(表S1):d许可条款包括“一般研究用途”、“健康或医学或生物医学用途”、“疾病特定研究”和“仅用于人口起源或祖先研究”,并且是明确允许的用途或重点研究领域。AMED生物样本库网络(GEM日本)203,900d修改条款在允许范围内增加要求、限制或约束(图1)。DUO是用例驱动的,并要求使用新的数据术语H3非洲162021年2月对使用DUO注释的数据集进行的普查突出了该标准的广泛采用。早期的实现者,如EGA,现在要求在数据集提交时进行DUO注释。BBMRI-ERIC等新部件才刚刚开始注释过程。AMED Biobank已经做了大量的DUO注释,因为他们认为每个样本都是自己的数据集。补充信息中描述了EGA中的示例实现。机器可读DUO术语(表1)。DUO已被广泛数据使用监督系统(DUOS)等软件充分利用,以实现数据集上访问请求和DUO注释之间的自动匹配(请参阅Cabili等人的文章)。7在这项研究中,我们报告了DUO标准,描述了精心策划的结构化词汇表和层次结构,并回顾了实施DUO管理和访问生物医学数据集的用例和注意事项DUO已被广泛用于注释全球的基因组数据集,其使用正在扩展到直接映射到同意书和自动匹配DAC的请求权限。DUO的未来用途包括对不同数据类型的注释,例如GA4GH护照签证中的样本和集成。设计DUO是一个标准的人类和机器可读的数据使用术语的结构化词汇表。DUO美国国立卫生研究院基因型和表型数据库,NIH dbGaP,8和欧洲基因组表型档案,EGA9),以及由GA4GH监管和伦理工作流(REWS)开发的政策工具。3,10名来自这些努力的参与者加入了数据使用小组,该小组通过视频会议和面对面会议定期开会。此外,还审查了知情同意本体(ICO)11等外部工作的互操作性和协同进化; DUO已直接导入ICO,以描述数据使用条件,而不是复制其内容。DUO术语旨在成为DUO必须由促进和促进数据共享的特定用例支持。每个DUO术语都是基于社区专家和实施者的贡献和评论而开发的。对DUO的贡献是公开的,通过提出GitHub问题创建;12任何人都可以提交请求,以添加新术语或对现有请求进行评论。DUO工作流负责人和驱动程序项目实施者在跟踪器、DUO邮件列表和定期电话会议期间讨论请求。一旦获得批准,修改将向公众开放,供公众在评论期内进一步讨论。2周,根据DUO治理政策。13DUO是以万维网联盟标准Web本体语言(OWL)14实现的DUO的开发遵循开放生物医学本体(OBO)开发原则,15确保与其他本体资源(如描述疾病实体的资源)的互操作性。16根据OBO指南,DUO是在基本形式本体(BFO)17上层本体下构建的 。 DUO 根 项 “data use permission” 和 “data use modifier” 是“data item” ( IAO : 0000027 ) 的 子 类 , 本 身 是 “informationartifact entity” ( IAO : 0000030 ) 和 “generically dependentcontinuant”(BFO:0000031)的类型。虽然BFO为DUO层次结构提供了框架,但它被证明对大多数用户来说是令人困惑的。因此,我们与EMBL-EBI Ontology Ontology Database Service(OLS)18的开发人员合作,设计并实现了一个系统,允许在DUO Hi-Ammory中选择合适的入口级别。图2中所示的DUO术语是稳定的,每个DUO术语都有其唯一的统一资源标识符,可以使用OLS浏览。最重要的是,与特定DUO ID相关的含义是永久的;这保证了数据使用术语的一致性。DUO的不同版本可通过GitHub存储库获得,19包括捕获正在进行的开发和稳定发布版本的编辑版本。DUO的发布版本与用于可持续性的永久URL( PURL ) 相 关 联 :20 最 新 的 发 布 总 是 可 从http://purl.obolibrary.org/obo/duo.owl获得,而先前的版本可以通过其基于日期的PURL来访问,为更喜欢使用本体的特定历史视图的用户提供选择21,22以在过渡到最新版本时保持稳定性。布罗德研究所225EGA 1,021BBMRI-ERIC进行中。数据管理员发布DUO注释指南:https://doi.org/10.5281/zenodo.44277314细胞基因组学1,100028,2021会开放获取技术图1.数据使用本体权限和修饰语DUO是数据使用术语的分级词汇表,最常用于表示受控访问数据集的二级使用条件。DUO并不旨在表示所有可能的数据使用术语、同意短语或权限、限制或要求的复杂逻辑排列。截至2021年6月,DUO包含25个术语,代表两种类型的数据使用术语,即许可和修饰符。诸如一般研究用途(GRU)、健康或医学或生物医学用途(HMB)、疾病特异性研究(DS)以及人口起源和遗传学研究(POA)等标准化了数据集的允许使用修饰符用于进一步限定受控访问的主要类别。术语位于DUO层次结构中,因此子类是比它们的父类更具体的实例集这使得新的知识推理,通过描述-灰逻辑支撑OWL推理。23例如,当搜索用于“疾病特异性”研究用途的数据集时(图2),研究人员将看到与此使用术语及其父类匹配的存储库的初始结构是使用本体开发工具包生成的,24它提供了一种创建本体项目的方法,可以随时推送到GitHub。本体的开发遵循模块化的方法,以便DUO的开发人员和用户都具有更大的灵活性。例如,DUO日语翻译被存储为与主本体分开的单独文件此文件在发布时通过自动脚本合并,允许不同的文件和功能保持独立,直到它们准备发布和/或在发布时按需排除-例如,对于不需要从英语翻译同样的脚本还执行SPARQL25查询来呈现CSV版本,同样是为了方便人类在GitHub存储库中浏览。最后,脚本合并通过MIREOT方法26导入的外部本体的相关子集,以促进本体重用和跨资源的本体项的一致标识。为了提高社区意识和参与度,DUO托管在一个开放的集中式GitHub存储库下。这使得版本标记和持续集成测试能够通过Travis CI软件在每次迭代中运行每次在修改源文件之后,运行ELK推理器27以确保本体的持续一致性。结果为了确保其技术标准的可信赖性和可持续性,GA4GH采用了开放和一致的开发和产品批准流程。 1于二零一九年,DUO获GA4GH督导委员会一致批准为GA4GH标准,加入GA4GH基因组工具包套件的其他产品。1图3显示了DUO的当前实现者。DUO已被纳入数据访问请求过程的几个核心方面(框1)。首先,DUO术语被应用为数据集元数据,与它们描述的数据一起存储在存储库中,使得数据用户更容易合规地管理他们的数据集,并方便研究者通过他们的数据使用术语查询数据集。存储库可以向其数据集文件添加DUO注释,可以通过对现有数据的管理进行回顾,也可以在提交时进行交互。用户可以根据数据使用术语搜索数据集,以在请求数据访问之前确定哪些数据集可用于其目的。数据集的可访问性和互操作性得到改善,提高了数据集的公平性:28在2020年4月至10月期间申请访问桑格癌症基因组计划(CGP)数据集的数据请求者中,有2.6%在第二个用例中,DAC利用DUO术语来促进并首次自动化细胞基因组学1,100028,2021年11月10日5技术会开放获取图2.浏览数据使用本体DUO OWL文件已经被加载到人类友好的浏览器中,例如本体查询服务(OLS)。这使得能够在层次结构中进行交互式导航,并显示其他属性,如定义、注释或与其他术语的关系。例如,“疾病特异性”研究“朵术语,http://purl.obolibrary.org/obo/DUO_0000007澄清了它应该与疾病本体的术语结合使用。“首选根术语”按钮(中间的绿色活动复选框)指导向用户显示顶级类,而不是呈现复杂的上层BFO层次结构(可通过选择“所有术语”讨论数据访问请求过程。DUO在电子数据访问系统中的使用通过DUOS7,在NIH和布罗德研究所试行了数据访问请求自动化,目前正在推广到其他数据库。DUOS软件平台执行基于DUO的自动化数据使用监督,并提供接口以简化DAC的工作。对结果的经验评价表明,DUO是一种有效的方法。广泛有用,与检查中约96%的同意条款数据集,并使用DUOS来自动化该过程简化审查过程,同时保持有效性和一致性。作为第三个用例,DUO术语被纳入研究开始时撰写的知情同意书中的数据共享语言。30,31在此早期阶段明确DUO术语对于实现更有效和一致的数据使用管理非常重要。这解决了目前在共同使用知情同意语言方面的挑战,这些语言没有完全涵盖与数据共享和次要研究目的相关的范围和问题,导致参与者对研究预期以及数据提供者和数据管理员或DAC在评估如何分发数据集时存在不确定性。机器可读同意指南中的同意条款附有解释和指导,以确保一致性,并确保前瞻性地捕获为机器可读数据使用条款。目前正在由IRB进行评估和验证,我们预计这将成为一项可以更广泛遵循的建议。自被批准为GA4GH标准以来,1DUO已在全球各种生物医学项目中广泛实施。除了对新数据使用术语的请求和评论之外,DUO标准实施者还通过提出其他语言(如日语)或“简明语言”的翻译做出了贡献,研究参与者。32为此,DUO已成功扩展为同意使用,如上文所述的机器可读同意指南,该指南于2020年 7月获批为GA4GH标准33,并正由IRB和研究积极审查和此外,社区成员对DUO的成功和简单性充满热情,旨在进一步将其应用范围从基因组数据集扩展到生物标本、成像数据和公共卫生数据等资源。芬兰卫生和福利研究所生物库34已经实施DUO,要求样本存放者在存放样本时描述样本/数据使用术语。事实上,没有什么可以阻止开发DUO的应用程序或扩展其他科学资源。该标准的成功外部扩展可以反馈到GA4GH,允许社区的实用性和功能的持续改进DUO术语也可以用于医疗保健环境和辅助标准。Health LevelSeven International(HL 7)HL7标准允许实现者为给定的使用术语采用默认规则(例如,默认情况下允许的所有内容,默认情况下限制的所有内容),然后指定例外。LegalRuleML和ADA-M明确定义编码数据使用的规则是许可、禁止还是条件。这种方法需要用户将6细胞基因组学1,100028,2021会开放获取技术图3.数据使用本体的当前实现DUO已被用于注释全球的基因组学数据集。截至2021年11月,实施者包括北美、欧洲、非洲、欧洲、亚洲和澳大利亚的存储库、数据库和项目。该研究GA4GH DUO标准代表了数据管理专业人员在共享生物医学数据集时常用的数据使用术语,同时最大限度地减少了数据使用术语逻辑排列的复杂性,这对全球互操作性和数据共享至关重要。38例如,DUO采用术语这种对DUO术语空间的有意限制受到了研究人员的鼓励,这与DURI领导层将DUO作为促进术语兼容性的简明标准的愿景一致相反的论点支持DUO和对有限词汇的渴望一个经常用来证明这种相反立场的红鲱鱼例子是,罕见疾病研究参与者经常认为DUO的有限范围无法代表他们所患的独特的特定疾病,例如共济失调-毛细血管扩张症或Diamond-Blackfan贫血。然而,这反映了理解的颠倒,因为允许独特的,边缘案例类型的研究将通过许多现有的DUO术语被允许,特别是那些如一般研究用途和健康/医疗/生物医学用途。用更一般的DUO术语注释这些数据集也增加了研究人员达到这些数据集的可能性。这些发现可能会影响预防和治疗此类疾病的科学发现。最终,在与DUO团队合作后,RARE-X罕见病社区的代表成为DUO的强烈支持者,并倡导在其他罕见病参与者群体中使用DUO。为了帮助DUO的未来采用者澄清这一点,DURI工作流正在积极开发DUO实施指南,并正在评估是否可以提供基于DUO的软件服务,以帮助团体选择适合他们需求的DUO术语。目前,DUO的实施和使用可能受到将知情同意书语言追溯翻译为DUO术语的需要的限制。这限制了可能的数据集注释数量,并可能在将遗留同意书条件映射到DUO术语时产生变化。为了前瞻性地缓解这个问题,我们已经完成了机器可读同意指南29,提出了一个已经映射到DUO术语的同意书。DUO还支持DAC和数据保管人举办关于如何将同意书翻译为DUO术语的研讨会和培训。结论DUO已在全球范围内用于注释超过20万个数据集,以描述人类生物医学数据的数据使用条件(表1)。GA4GH DUO和护照标准是简化数据访问的联合战略的一部分,尚未连接以实现单一流程。作为下一步,GA4GH的DURI工作组计划将DUO条款整合到护照签证中,并倡导政策转变,通过数据使用配置文件而不是个性化数据集来批准访问数据集组。这将允许会开放获取技术细胞基因组学1,100028,2021年11月10日7例如,保护知识产权。第2步:数据集注释受控访问存储库中托管的数据集使用DUO术语进行注释,DUO术语表示必须遵守的数据使用术语,以获得二级数据使用的批准。DUO术语可由存储库客户针对遗留数据集进行回顾性添加和/或由数据存储者在数据提交时进行前瞻性第3步:数据集发现研究人员可以使用DUO术语在数据存储库中搜索具有相关使用条件的数据集。例如,他们可以搜索所有同意用于黑色素瘤研究的数据集。这将仅返回在给定此特定条件下允许使用的数据集列表。或者,研究人员可以查询他们用例的特定数据集,而不需要联系DAC或其他帮助资源。该过程允许研究人员简化识别合适数据集的过程,并避免不必要的数据访问请求提交。第4步:数据访问请求研究人员请求访问相关数据集,并使用DUO术语描述研究目的。这使得DAC能够手动或使用自动匹配算法进行有效的分类DAC审查访问请求,以确定拟议的研究是否符合数据使用条款,如果是,则授予研究人员访问数据集的权限DUO术语的使用有助于DAC进行简化和标准化的审查通过认证的研究人员在登录后自动访问与其DAC批准的数据使用配置文件匹配的新的和以前的数据集进一步精简存取程序将最大限度地减少在为特定项目或在新的储存库发布新数据时连续多次提出请求的需要。这种方法也为在DAC之间建立信任和增强批准过程中的一致性树立了先例:我们设想用户的数据使用配置文件可以在DAC之间共享。随着生物医学数据集在不同环境中产生的数量越来越多,依赖基于DUO的机制对于简化数据访问以实现科学合作至关重要STAR+方法本文件的在线版本提供了详细的方法,包括以下内容:d关键资源表d资源可用性第1步:知情同意书注释数据捐赠者-试验和研究的参与者-同意书中描述的数据使用目的。知情同意书由研究团队根据国家、地方或机构法规和/或政策编写。为了保持管理和可访问性,这些表格应采用明确的数据使用条款,模板应公开。DUO标准数据使用条款可以直接嵌入同意书的条款中,GA 4GH机器可读同意指南-安斯。29组织可以添加其他使用参数-框1.DUO在数据访问过程的每一步会开放获取技术8细胞基因组学1,100028,2021B电极导线触点B材料供应情况B数据和代码可用性d方法样本BDUO的演变补充信息补 充 信 息 可 以 在 www.example.com 上 找 到 https://doi.org/10.1016/j 。xgen.2021.100028。致谢作者想感谢GA4GH数据使用和研究人员身份(DURI)工作流。我们还要感谢EMBL-EBI Ontology Ontology Service的开发人员(Simon Bronze p、NicoMa- tentzoglu和Henriette Harmse)的贡献,他们实现了感谢Stephanie Li对本手稿和其他DUO材料的图形和设计的持续帮助。DUO标志由EMBL-EBI的Spencer Philips 设 计 。 我 们 感 谢 Angela Page , Michael Baudis 和 PeterGoodhand ( GA 4GH ) , Ewan Birney ( EMBL , GA 4GH ) , BarthaKnoppers和Anne-Marie Tasse '(麦吉尔大学),Ayad Aliomer(Optum),Michele Mattioni(七桥),Neil Otte(布法罗大学)和Cooper Stansbury(密歇根大学)的支持。M.A.S. 和 E.J.v.E. 感 谢 Jelmer Veen 、 Marije van der Geest 和 AneasHodselmans对BBMRI-NL目录工作的贡献。G.K.,M.A.F.,惠普,J.D.S. 和MC。由EMBL-EBI核心基金和WellcomeTrust GA 4GH奖号201535/Z/16/Z资助T. Burdett由EMBL-EBI核心基金资助。T. Boughtwood由NHMRC GNT 111353,GNT 200001和澳大利亚MRFF资助。P.A.由ELIXIR卢森堡资助。 S.D. 和K.R. 由布罗德研究所资助。M.A.H. 和M. B。 获得NIH资助#5R24OD011883。 M.L. 和M.C.由CINECA项目(H2020 No 825775)资助。新墨西哥州和L.Z. 由H3ABioNet资助,NIH资助号为U24HG006941。S.O. 和C.Y. 从日本医学研究和发展机构(AMED)获得资助,资助号为JP 19kk020501和JP 18kk 0205012。A.A.P.由NHGRI AnVIL资助,奖项编号U24HG010262。F. P.在一定程度上得到了欧盟地平线2020研究和创新计划的支持,该计划M.A.S. 和E.J.v.E. 由 FAIR 基 因 组 ( ZonMW #846003201 ) 和 EOSC-Life ( H2020#824087)资助。S.V.由英国政府的行业战略挑战基金资助。G.S.是由ELIXIR资助的,ELIXIR是生命科学数据的研究基础设施。作者贡献所有作者都参与了调查和撰写-审查和编辑。J.L.,M.N.C.,医学博士,J.D.S.和A.A.P.对概念化做出了贡献。J.L.,G.A.R. 尽快,S. D.,美国科学院,L.L.R. T.H.N. 医学博士,M.N.C.,AJ B F.J.S.O.M.D. S.R.B. H.C.,G.K.,和T. Boughtwood对验证做出了贡献。G.K.,T.Boughtwood,H.C.,S.R.B. 嗯,S.O. M. Kawashima,M. M.,纽约,S.N.,CH S.K.,AJ J.R.,J.D.S. 文学硕士,E.J.v.E.,SV,C.Y.,和L.Z.贡献转向数据管理。医学博士,J.L.,AT T. Boughtwood,G.K.,私人助理,S.R.B. H.C.,P.H.,惠普,FP,J.R.,AJ G.S.,J.D.S. 文学硕士,SV,CV,S.O. M. 川-shima,新墨西哥州,和C.Y.有助于撰写原始草稿。申报利益M.N.C. 是基金会医学的雇员和罗氏的股权持有人A.A.P.是GV的风险投资合伙人,也是字母公司的雇员。他获得了微软、Verily、IBM、英特尔、拜耳和诺华的资助。L.L.R.是提交人包容性和多样性本文的一位或多位作者自我认同为科学界代表性不足的本文的一位或多位作者自我认同为LGBTQ+社区的成员。投稿时间:2021修订日期:2021接受日期:2021发布时间:2021引用1. H.L.,Page,A.J.H.,史密斯湖,亚当斯,J.B.,Alterovitz,G.,Babb,L.J.,巴克利议员Baudis,M.,博韦,M.J.S.,Beck,T.,等(2021年)。GA4GH:基因组研究和医疗保健数据共享的国际政策和标准。细胞基因组学1,100029-1-100029- 33。2. Thorogood , A., H.L. , 古 德 汉 德 , P. , Page , A.J.H. , Joly , Y. ,Baudis,M.,Rambla,J.,Navarro,A.,Nyronen,T.H.,Linden,M.,等人(2021年)。使用GA4GH标准的国际基因组医学数据库联合会。细胞基因组学1,100032-1-100032-5。3. Woolley,J. P.,Kirby , E.,莱 斯利 ,J。, Jeanson ,F. ,Cabili,M.N.,拉什顿,G.,哈泽德,J.G.,Ladas,V.,C.D.小牛肉吉布森,S.J.,等人(2018年)。通过“自动化数据处理和访问矩阵”(ADA-M)负责任地共享生物医学数据和生物标本。npj Genomic Med.3,1-6.4. GA4GH数据使用和研究人员ID工作流。https://ga4gh-duri. github.io/网站。5. Voisin,C.,Linden,M.,戴克,S.O.M.,Bowers,S.R.,Reinold,K.,Lawson,J.,Li,S.,Ota Wang,V.,巴克利议员Bernick,D.,等(2021年)。GA4GH通行证标准的数字身份和访问权限。细胞基因组1,100030-1-100030-12。6. GA4GH 驱 动 程 序 项 目 。 https://www.ga4gh.org/how-we-work/driver-projects/.7. Cabili,M.N.,Lawson,J.,Saltzman,A.,拉什顿,G.,O'Rourke,P.,威 尔- 班克 斯,Rodriguez ,L.L. ,Nyronen ,T., Courtot ,M. ,Donnelly,S., 还有菲尔·伊帕基斯,戒酒会.(2021年)。数据使用监督自动化方法的实证验证。细胞基因组学1,100031-1-100031-6。8. Tryka,K.A.,豪湖,Sturcke,A.,Jin,Y.,王正云,兹亚巴里湖李,M.,Popova,N.,Sharopova,N.,Kimura,M.,和Feolo,M.(2014年)。NCBI的基因型和表型数据库:dbGaP。Nucleic Acids Res. 42,D975-D979。9. 拉帕莱宁岛Almeida-King,J.,Kumanduri,V.,Senf,A.,Spalding,J.D.,Ur-Bullman,S.,桑德斯,G.,Kandasamy,J.,Caccamo,M.,莱诺宁河,等(2015年)。欧洲人类基因组-表型组数据档案同意用于生物医学研究。Nat. Genet. 47,692-695。10. 戴克,S.O.M.,Philippakis,A.A.,Rambla De Argila,J.,Paltoo,D.N.,卢埃-克梅尔,E.S.,Knoppers,B.M.,布鲁克斯,A.J.,Spalding,J.D.,汤普森,M.,Roos,M.,等人(2016年)。 同意代码:遵守标准数据使用条件。PLoS基因组12,e1005772。11. Lin,Y.,(1996年),哈里斯先生曼尼昂,F.J.,Eisenhauer,E.,Zhao,B.,施伟, Kar-novsky,A,和He,Y. (2014年)。基于BFO的知 情 同 意 本 体 ( ICO ) 的 开 发 。 第 五 届 生 物 医 学 本 体 论 国 际 会 议(ICBO),休斯敦,得克萨斯州,美国。12. DUO追踪器。https://github.com/EBISPOT/DUO/issues网站。13. DUO治理政策。https://github.com/EBISPOT/DUO/blob/master/Governance2021.mdwww.example.com14. Web本体语言参考。https://www.w3.org/TR/owl-ref/网站。15. 史密斯,B.,Ashburner ,M.,Rosse ,C.,Bard,J.,巴格,W.,Ceusters,W., Gold-berg,L.J.,Eilbeck,K.,爱尔兰,A.,Mungall,C.J.,等; OBI Consortium(2007年)。OBO Foundry:本体的协调进化会开放获取技术细胞基因组学1,100028,2021年11月10日9以支持生物医学数据集成。国家生物技术25,1251-1255。16. Shefchek , K.A. , 哈 里 斯 , 北 卡 罗 来 纳 州 , Gargano , M. ,Matentzoglu,N.,Unni,D.,
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功