没有合适的资源?快使用搜索试试~ 我知道了~
会开放获取透视GA4GH:国际政策和标准用于基因组研究和医疗保健的数据共享海蒂湖1,2,47安吉拉J.H.Page,1,3,*Lindsay Smith,3,4Jeremy B.亚当斯,3,4吉尔阿尔特罗维茨,5,47劳伦斯J。巴布,1马克西米利安P巴克利,6迈克尔鲍迪斯,7,8迈克尔J.S.博韦,3,9蒂姆贝克,10雅克S。贝克曼,11岁塞尔吉·贝尔特兰,12,13,14大卫·伯尼克,1亚历山大·贝尼尔,9詹姆斯·K。邦菲尔德,15蒂凡尼F。博伍德,16,17纪尧姆布尔克,9,18萨里昂R。鲍尔斯,15安东尼J布鲁克斯,10迈克尔布鲁德诺,18,19,20,21,38马修H。刷,22大卫布约德,9,18,38托尼伯德特,23猎户座J布斯克,24莫兰N。1Daniel L.卡梅隆,25,26罗伯特J卡罗尔,27埃斯梅拉达卡萨斯席尔瓦,123德比亚尼查克拉瓦蒂,29比普乔达里,30,31舒惠陈,32J迈克尔切里,33贾斯汀娜钟,3,4梅丽莎克莱恩,34海莉L。Clissold,15Robert M. Cook-Deegan,35岁Me' lanie Courtot,23岁菲奥娜坎宁安,23米罗库帕克,6罗伯特M。戴维斯15岁丹妮尔·丹尼斯科19岁梅根·JDoerr,36Lena I.Dolman,19岁(作者名单见下页)1Broad Institute of MIT and Harvard,Cambridge,MA,USA2马萨诸塞州总医院,波士顿,MA,美国3加拿大安大略省多伦多市全球基因组学与健康联盟4加拿大安大略省多伦多市安大略省癌症研究所5美国马萨诸塞州波士顿市布里格姆妇女6DNAstack,Toronto,ON,加拿大7苏黎世大学,苏黎世,瑞士8SIB瑞士生物信息学研究所,瑞士9加拿大蒙特利尔麦吉尔大学10英国莱斯特莱斯特大学11瑞士洛桑洛桑大学12CNAG-CRG,基因组调控中心(CRG),巴塞罗那科学技术研究所,西班牙巴塞罗那13Universitat Pompeu Fabra(UPF),Barcelona,Spain14 Universitat de Barcelona,Barcelona,Spain15 Wellcome Sanger Institute,Hinxton,UK16Australian Genomics,Parkville,VIC澳大利亚17澳大利亚维多利亚州帕克维尔默多克儿童(联系方式见下页)总结全球基因组学与健康联盟(GA4GH)旨在通过协调的数据汇总和联邦化方法,实现临床和基因组数据的负责任共享,从而加速生物医学进步基因组测序(以及其他全基因组分子测序)的成本不断降低,其临床实用性的证据越来越多,这将很快推动数千万人类序列数据的产生,并增加多样性水平从这个角度来看,我们提出了GA4GH战略,以应对这场数据革命的主要挑战我们描述了GA4GH组织,该组织由8个工作流的开发工作推动,并由24个驱动项目和其他关键利益相关者的需求提供信息。我们提出了安全,互操作的技术标准和政策框架的GA4GH套件,并审查了标准的现状,其相关性的研究和临床护理的关键领域,以及GA4GH的未来计划广泛的国际参与建立,采用和部署GA4GH标准和框架将促进前所未有的数据共享努力,这对推进基因组医学和确保所有人群都能获得其益处至关重要。介绍《世界人权宣言》指出,人人有权分享科学进步及其带来的利益。1,2为了充分发挥基因组科学对于广大的人群,研究人员和临床医生必须一起就收集、存储、传输、访问和分析分子和其他健康相关数据的通用方法达成一致否则,这些信息将仍然孤立于个别疾病地区、机构、国家或其他组织内。CellGenomics 1,100029,November 10,2021 <$2021作者。1这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。会开放获取透视2细胞基因组学1,100029,2021Edward S.鸽子,37L。乔纳森·杜尔西,20岁,38岁斯蒂芬妮·奥姆9James A.埃迪,36凯伦埃尔贝克,39凯尔P埃尔罗特,22苏珊费尔利,3,23哈立德A。Fakhro,40,41Helen V. Firth,15,42Michael S.菲茨西蒙斯,43马克·费登,6保罗·弗利切克,23岁伊恩·MFore,28Mallory A.Freeberg,23Robert R.Freimuth,44Lauren A.Fromont,50Jonathan Fuerth,6ClaraL.Gaff,16,17,25,26Weiniu Gan,32Elena M.加纳伊姆,45岁的大卫·格雷泽,46岁的罗伯特·C·格林,5,47玛拉基格里菲斯,48奥比L。格里菲斯,48岁RobertL. 格罗斯曼,43都铎格罗扎,49海梅M。古德里奥维尔,28罗德里克吉格奥,1350迪帕扬古普塔,23梅丽莎A。Haendel,51 Ada Hamosh,52 David P. 汉森,16,81里斯K. 哈特,1,98,122迪安·米切尔·哈特利,53岁大卫·豪斯勒,34,125岁,雷切尔·M。Hendricks-Sturdham,54Calvin W.L. Ho,55Ashley E. Hobb,6Michael M.霍夫曼,19,20,21奥利弗·M.霍夫曼,19,26彼得霍卢布,56,57雅各布舒瑞徐,58让皮埃尔胡博,59莎拉E。亨特,23阿马尔胡萨米,60朱利叶斯O。Jacobsen,61Saumya S.Jamuar,62,63Elizabeth L.简斯,3,64弗朗西斯·让森,124艾娜·杰尼,50岁安珀湖约翰,65岁扬·乔利,9岁史蒂文·J. M.琼斯,67亚历山大卡尼茨,8,68加藤和人,69托马斯M。基恩,23,70克里斯蒂娜·凯克西·拉弗朗斯,3,9杰罗姆·凯莱赫,71吉赛尔·克里,23Seik Soon Khor,72,73巴莎·M。Knoppers,9Melissa A. Konopko,74Kenjiro Kosaki,75Martin Kuba,57Jonathan Lawson,1Rasko Leinonen,23Stephanie Li,1,3Michael F.林,76米凯尔林登,77,78刘祥林,64伊苏乌达拉利扬内,23哈维尔洛佩兹,99安妮克M。Lucassen卢卡斯79(作者名单见下页)18加拿大计算基因组学中心,加拿大19加拿大安大略省多伦多市多伦多大学20加拿大安大略省多伦多市大学健康网络21加拿大安大略省多伦多市矢量研究所22俄勒冈健康与科学大学,波特兰,OR,美国23欧洲分子生物学实验室,欧洲生物信息学研究所,英国24PhenoTips,多伦多,ON,加拿大25Walter and Eliza Hall Institute of Medical Research,Parkville,VIC,Australia26University of Melbourne,Melbourne,VIC,Australia27Vanderbilt University Medical Center,Nashville,TN,美国28美国国立卫生研究院国家癌症研究所,美国马里兰州贝塞斯达29美国纽约州纪念斯隆凯特琳癌症中心30美国俄亥俄州哥伦布市全国儿童31俄亥俄州立大学,哥伦布,俄亥俄州,美国32美国国立卫生研究院国家心肺血液研究所,美国马里兰州33斯坦福大学,斯坦福,加利福尼亚州,美国34UC Santa Cruz Genomics Institute,Santa Cruz,CA,USA35亚利桑那州立大学,华盛顿特区,美国36SageBionetworks,西雅图,华盛顿州,美国37爱丁堡大学,爱丁堡,英国38加拿大基因组分布式基础设施(CanDIG),加拿大安大略省多伦多39University of Utah,Salt Lake City,UT,美国多哈,卡塔尔41Weill Cornell Medicine-卡塔尔,多哈,卡塔尔42Addenbrooke45国家人类基因组研究所,国立卫生研究院,美国马里兰州46Verily Life Sciences,South San Francisco,CA,USA47哈佛医学院,波士顿,马萨诸塞州,美国48美国密苏里州圣路易斯市华盛顿大学医学院49Pryzm Health,悉尼,澳大利亚50基因组调控中心(CRG),巴塞罗那科学技术研究所,西班牙51科罗拉多大学安舒茨医学院,奥罗拉,CO,美国52约翰霍普金斯大学,巴尔的摩,MD,美国53Autism Speaks,Princeton,NJ,美国54杜克-马戈利斯卫生政策中心,华盛顿特区,美国55香港大学,香港,香港56BBMRI-ERIC,格拉茨,奥地利57Masaryk University,布尔诺,捷克58国立台湾大学台北市台湾59E'colepolytechniquefe'de'raledeLausanne(EPFL),Lausanne,Switzerland60辛辛那提儿童会细胞基因组学1,100029,2021年11月10日3(联系方式见下页)4细胞基因组学1,100029,2021会开放获取透视迈克尔·卢科夫斯基,43岁,爱丽丝·L。曼恩,3,15约翰·马歇尔,66米歇尔·马蒂奥尼,80亚历杭德罗·梅特克-希门尼斯,81安娜米德尔顿,82,83理查德J米尔恩,82,83弗鲁齐纳莫尔纳'r加'博尔,84尼古拉穆德,85莫妮卡C。穆诺兹-托雷斯,51里什-纳格,23中川秀胁,86,87贾马尔-纳西尔,88阿卡迪-纳瓦罗,50,89,90,91特里斯坦-H。尼尔森,92阿尼亚尼维尔斯卡,23艾米尼塞尔,17,2 6,9 3杰弗里牛,20汤米H。 尼伦,77,78布莱恩·D。奥康纳,1萨宾·奥斯特尔,8大岛宗一,94王太田,28劳拉·帕格里奥内,95,96埃米利奥·帕伦博,13,50海伦·E。帕金森,23安东尼A。Philippakis,1Angel D. Pizarro,97Andreas Prlic,98Jordi Rambla,13,50Augusto Rendon,99Renee A。Rider,45Peter N. 罗宾逊,100,101库尔特W.罗达默,102劳拉莱曼罗德里格斯,103艾伦F。鲁宾,25,26曼努埃尔鲁埃达,50格雷戈里A。拉什顿,1罗莎琳·S瑞恩,加里岛104桑德斯,74海伦Schuilenburg,23托尔斯滕施韦德,8,68塞雷娜斯科伦,74亚历山大森夫,105内森C。谢菲尔德,106Neerjah Skantharajah,3,4Albert V. Smith,107Heidi J. Sofia,45Dylan Spalding,77,78Amanda B.斯普尔多,108佐尼察斯塔克,16,17,26林肯D。Stein,4,19Makoto Suematsu,75Patrick Tan,62,109,110Jonathan A. 74Alastair A.汤姆森,32阿德里安Thorogood,9,111蒂莫西L。Tickle,1Katsushi Tokunaga,73,112JuhaToürnroos,77,78DavidTorrents,90,114SeanUpchurch,113AlfonsoValencia,90,114RomanVallsGuimera,26Jessica Vamathevan,23Susheel Varma,23,115Danya F。Wears,17,26,93,116Coby Viner,19,20Craig Voisin,117(作者名单见下页)61伦敦玛丽女王大学,英国62新加坡国立大学基因组医学中心,新加坡,新加坡共和国63新加坡国立大学精准医学研究所,新加坡,新加坡共和国64滑铁卢大学,滑铁卢,安大略省,加拿大65Garvan Institute of Medical Research,Darlinghurst,NSW,Australia66格拉斯哥大学,格拉斯哥,英国67加拿大68瑞士巴塞尔大学69日本大坂大学吹田分校70英国诺丁汉大学71英国牛津大学牛津分校72日本东京国立全球健康医学中心医院73University of Tokyo,Tokyo,Japan74ELIXIR Hub,欣克斯顿,英国75庆应义塾大学医学院,日本76mlin.net LLC,San Jose,CA,USA7779英国南安普敦大学医学院80Seven Bridges,波士顿,美国81澳大利亚电子保健研究中心,CSIRO,澳大利亚昆士兰州赫斯顿82Wellcome Connecting Science,Hinxton,英国83剑桥大学,英国84德国海德堡科学与人文学院85H3ABioNet,计算生物学部,IDM,健康科学学院,南非开普敦86日本医学研究开发署(AMED),日本东京87日本横滨理研综合医学科学中心88北安普顿大学,北安普顿,英国89进化生物学研究所,庞培法布拉大学,西班牙巴塞罗那90Incubucio'CatalanadeRecercaiEstudisAvancQuarters,巴塞罗那,西班牙91西班牙巴塞罗那帕斯夸尔·马拉加尔基金会巴罗纳贝塔脑研究中心92Genomic Medicine Institute,Geisinger,Danville,PA,USA93澳大利亚人类遗传学学会教育、伦理社会问题委员会,澳大利亚94日本仙台东北大学95美国纽约州纽约市球形奶牛集团96美国纽约州纽约市Laura PaglioneLLC97亚马逊网络服务公司,关闭WA,USA98Invitae,旧金山,CA,美国99Genomics England,伦敦,英国100The Jackson Laboratory,Farmington,CT,美国101University of Connecticut,Farmington,CT,美国102国家生物技术信息中心,国家医学图书馆,国立卫生研究院,美国马里兰州贝塞斯达103以患者为中心的结局研究所(PCARI),华盛顿特区,美国104Bicgen Foundation Inc,Arlington Heights,IL,美国细胞基因组学1,100029,2021年11月10日5会开放获取透视(联系方式见下页)6细胞基因组学1,100029,2021会开放获取透视亚历克斯·H瓦格纳,30,31岁苏珊·E华莱士,10布赖恩P沃尔什,22马克S。威廉姆斯,92伊娃C。温克勒,118芭芭拉J沃尔德,113格兰特M。伍德,126J。帕特里克·伍利,71岁,山崎千里,69岁,安德鲁·D。Yates,23Christina K.Yung,4,119Lyndon J.Zass,85Ksenia Zaytseva,9,120Junjun Zhang,4Peter Goodhand,3,4Kathryn North,17,19,26和EwanBirney23,121105Congenica有限公司,英国剑桥106University of Virginia,Charlottesville,VA,美国107University of Michigan,Ann Arbor,MI,美国108澳大利亚昆士兰州赫斯顿的QIMR Berghouth医学研究所109新加坡的精密健康研究所110新加坡的基因组研究所111卢森堡大学,Alzette河畔,卢森堡112日本东京国家全球健康与医学中心113美国加州理工学院帕萨迪纳114西班牙巴塞罗那超级计算中心115英国伦敦健康数据研究中心116澳大利亚维多利亚州帕克维尔墨尔本大学墨尔本法学院117Google LLC,Kitchener,ON,加拿大118德国海德堡大学医院转化医学伦理科119Indoc Research,多伦多,加拿大120加拿大计算基因组学中心,加拿大魁北克蒙特利尔121欧洲分子生物学实验室,德国海德堡122MyOme公司,美国123Kelly Government Solutions,罗克维尔,马里兰州,美国124Datadex Inc.,天气-多伦多,加拿大125Howard Hughes Medical Institute,University of California,Santa Cruz,CA,USA126Salt Lake City,UT,美国*通讯地址:www.example.comangela.page@ga4gh.orghttps://doi.org/10.1016/j.xgen.2021.100029司法管辖区,锁定其潜力,以促进研究和医学进步。全球基因组学与健康联盟(GA4GH)是一个由基因组学研究人员、数据科学家、医疗保健从业者和其他利益相关者组成的全球联盟。我们正在合作建立政策框架和技术标准,以便负责任地在国际上共享基因组和其他分子数据以及相关的健康数据。GA4GH社区成立于2013年3,目前由90多个国家的1,000多名个人组成,共同努力实现超越任何单一机构或国家边界的广泛共享(见https://www.ga4gh.org)。从这个角度来看,我们提出了GA4GH的战略目标,并详细介绍了当前的战略和操作方法,以通过协调的数据聚合和联合方法来实现负责任的临床和基因组数据共享,我们描述了八个GA4GH工作流的技术和政策制定活动我们回顾GA4GH是如何解决基因组学目前部署的主要领域,包括罕见病,常见病,癌症和传染病。最后,我们描述了基因组序列数据之间的差异,产生的研究与医疗保健的目的,并定义策略,以满足独特的挑战,负责任地使访问数据在临床环境中获得。驾驭基因医学革命随着与人类基因组测序相关的成本持续下降,基因组测定越来越多地用于人类基因组测序。研究和医疗保健。因此,我们预计在未来十年内将产生数千万人类全外显子组或全基因组序列,其中很大一部分数据来自医疗保健环境,因此与临床信息相关。如果这些数据集可以共享,它们将为研究疾病的遗传基础提供巨大的希望5,并且将代表比传统研究中更多样化的人群;然而,来自个人医疗保健系统的数据很少在机构边界之外获得GA4GH旨在通过制定标准并促进其应用,在研究和医疗保健领域实现负责任的临床和基因组数据共享。[6]我们认为,如果没有这样一个联盟,基因组学在临床实践中的新兴效用将是缓慢的,更昂贵的,分散的,国家之间几乎没有协调。7GA4GH标准(见表1)使研究人员能够安全、负责地访问数据,而不管数据的物理位置如何技术标准使研究人员相信,其他人可以通过在相同的底层数据上运行相同的打包方法,使用相同的持久标识符来复制他们的工作。标准还使数据提供者相信,他们的数据正在被他们授权的研究人员根据他们的数据使用政策访问,而不会失去对多个下载数据副本的控制。因此,数据提供者可以确保其法律和道德要求得到维护,同时研究人员可以从全球数据资源和工具的使用中受益。随着新生的基因组医学项目在许多国家出现,我们认为,除了集中式数据共享之外,联合方法(见下文的联合访问细胞基因组学1,100029,2021年11月10日7会开放获取透视图1. 全球基因组学与健康联盟的矩阵结构GA4GH是一个由来自驱动项目和其他机构的不同利益相关者组成的社区,他们在工作流的背景下共同努力。每个GA4GH驱动程序项目预计将在至少两个GA4GH工作流中投入作为审查所有GA4GH可交付成果的基础小组,监管、道德和数据安全工作流必须代表每个驱动程序项目。除了驱动程序项目,社区的任何成员,无论领域,部门,国家或隶属关系,都被邀请参加任何GA4GH工作流。补充信息包括详细说明如何每个24 GA 4GH驱动程序Pro-EQUIPMENT相交的六个技术工作流。可行的,是必要的,以满足研究和医疗保健社区的目标。此外,许多商业和公共组织的目标是最大限度地减少复杂的技术软件的成本和风险,这些软件需要为基因组医学做出贡献或提供基因组工具。一个复杂的、多利益相关者的生态系统需要中立的、技术上合格的标准;这些标准必须适用于不同的目的,并对广泛的最终用户有用:临床、学术、商业和公众。最后,必须制定标准,有意识地支持全球研究社区,特别关注公平、多样性和包容性政策,以切实促进所有全球社区的进步。GA4GH组织GA4GH已与24个真实世界的基因组数据倡议(驱动项目)合作,以确保其标准符合目的并由真实世界的需求驱动。驱动项目承诺帮助指导GA4GH开发工作和GA4GH标准试点(见表2)。每个驱动项目预计将投入至少两个全职等同GA4GH标准的发展,这发生在GA4GH工作流的背景下(见图1)。工作流是GA4GH的关键生产团队,在整个数据生命周期中应对八个不同领域的挑战(见方框1)。工作流由来自各自子学科的专家组成,包括来自驱动项目的成员以及国际基因组学和健康界其他组织的专家。GA4GH标准开发和批准流程GA4GH工作流和驱动项目已经确定并正在积极开发他们认为最相关的技术规范和政策框架,以实现广泛的数据共享、联合方法和跨数据集的互操作性,从而促进基因组研究(有关产品开发的更多详细信息,请参阅补充信息流程);重点领域概述于方框1,个别产品定义于表1和2020/2021GA 4GH路线图(https://www.ga4gh.org/roadmap)。每个GA4GH可交付成果都可以单独实施,以实现单个领域的互操作性和一致性然而,当一起实施时,它们支持研究和临床领域的更广泛活动,并实现高效的基因组数据共享和协作分析,可以利用在世界各地不同地点产生的全球数据集。每个批准的GA 4GH可交付成果都由一个不参与产品开发的内部 和 外 部 专 家 小 组 进 行 审 查 https://www.ga4gh.org/about-us/governance-and-leadership-GA 4GH标准通常不受国家或国际 标 准 机 构 的 认 可 , 而 是 遵 循 互 联 网 工 程 任 务 组(IETF;https://www.ietf.org)和万维网联盟(W3C;http://www.w3.org)启发的模型。这使得能够灵活快速地响应社区需求,并通过开发和采用实用的标准来降低互操作性的障碍。然而,某些标准有时会受益于更正式的认证过程,特别是当与医疗保健使用有直接联系时(见下一节和方框2)。对准与其他标准组织为了实现更大的国际协调和标准制定的一致性,GA4GH积极与基因工程领域的其他标准制定组织合作,例如,健康七级(HL 7;http://www.hl7.org),国际标准化组织(ISO; https://www.example.com)。iso.org)、开放生物学和生物医学本体铸造(Open Biological and Biomedical OntologyFoundry; OBO;http://www.obofoundry.org/)。虽然GA4GH和其他标准制定机构之间的明确工作流程仍在开发中,但GA4GH已启动了几个试点项目,以探索合作机制。一个这样8细胞基因组学1,100029,2021会开放获取透视GA4GH工作流是该组织的关键生产团队每一个都处理数据生命周期中的特定区域,如下所述(Web资源中列出的URL)。(1) 数据使用研究人员身份:开发本体和数据模型,以简化对任何国家生成的数据集的全球访问9,10(2) 基因组知识标准:开发用于交换基因组变异观察结果和知识的规范和数据模型18(3) 云:开发联合分析方法,以支持从大型数据集中学习所需的统计严格性(4) 数据隐私&安全:制定指导方针和建议,以确保可识别的基因组和表型数据保持适当的安全性,而不会牺牲其分析潜力(5) 监管道德:制定政策和建议,确保个人层面的数据与现有规范互操作,并遵循核心道德原则(6) 发现:开发数据模型和API,使数据可查找、可访问、可互操作和可重用(FAIR)(7) 临床表型数据采集交换:开发数据模型,通过以标准化方式(8) 大规模基因组学:开发API和文件格式,以确保统一的技术平台能够支持大规模基因组学。计算框1. GA4GH工作流重点领域方法是将GA4GH标准提交ISO技术委员会批准为ISO国际标准。使用使ISO批准过程与GA4GH批准过程保持一致的产品开发时间轴,两个社区能够以协调的方式为标准的开发做出贡献这些努力扩大了这两个组织贡献者的多样性,导致更强大和国际适用的标准。在HL7工作组和专家的指导下,另一种方法是将GA4GH标准转化为HL7快速健康互操作性资源(FHIR)实施指南。这些实施指南实现了GA4GH标准与临床系统的互操作性,并加速了临床数据在研究中的使用。GA4GH还旨在支持现有的翻译模型、本体和术语(例如,FHIR , HGVS , OMOP , PCORnet , 人 类 表 型 本 体 论 ,SNOMED CT)用于临床遗传学和基因组学。21协调活动,如联合会议,共享文件,以及GA 4GH工作和这些健康标准之间的过程协调,对于弥合研究-临床鸿沟和保持各自产品一致至关重要。这有助于防止冗余标准的不必要扩散,并最大限度地减少语义和语法冲突标准的开发,这些标准可能会阻碍大规模的互操作性,并导致采用者社区的混乱(见框2)。联邦方法联合方法--跨多个不同且安全的站点分析数据的能力--越来越被视为一种重要的策略,其中数据由于法律或实际原因而不能被汇集。这些方法的特征在于在安全处理环境中托管数据的独立组织(例如,云、可信的研究环境),同时采用技术标准,使分析规模。24应用程序编程接口(API)可以部署,使研究人员和便携式工作流访问多个数据库,即使在数据和计算环境已重新配置的情况下。25“身份联合”等工具26GA4GH Driver Projects和其他合作伙伴开始实施基于GA4GH标准的云工作流,使科学家能够共享、访问和查询存储在全球不同站点的数据。这种访问模式的一些具体例子包括:(1)人类细胞图谱的数据协调平台,一个用于分析单细胞数据的国际联合计算环境;(2)Geno-Eye England(3)NHGRI基因组数据科学分析、可视化和信息学实验室空间(AnVIL)30和Gen 3数据通信,为科学家提供基于云的空间,以使用大规模基因组和基因组相关数据集和共享工具;以及(4)H3 ABioNet,一个生物信息学平台,为非洲大陆的研究人员提供来自非洲人类遗传和健康(H3 Africa)网络的数据,并提供用于分析数据的容器化工作流程。由于这些工作流是基于互操作标准构建的,因此可以实现安全访问和高效发现、可移植性和分析。有了更多这样的例子,全球社区将能够利用大数据的力量,提高基因组医学研究的覆盖范围。 标准所带来的联邦和透明度也将鼓励非西方国家和其他代表性不足的人口更愿意分享他们的数据,从而使可用的总体数据更加多样化,并使其影响更加公平。医疗保健中的基因组学测序基因组的过程在任何环境中基本上都是相同的,但是生产的规模和质量控制,31如细胞基因组学1,100029,2021年11月10日9会开放获取透视通过与现有标准、工具和资源保持一致,GA4GH旨在最大限度地减少冗余和竞争标准的不必要扩散。我们概述了三个具体的例子,证明GA4GH的努力,以配合现有的标准和标准开发组织。谱系质量标准:PED格式是用于交换谱系信息的众所周知的标准,并且广泛用于研究和临床设置(参见网络资源中的PLINK)。20然而,PED只允许表示基本的亲子关系,并不代表基因组学社区所需的所有数据元素和关系在此格式的基础上,GA4GH谱系子组已将PED格式数据元素映射到谱系数据模型,允许采用者过渡到更强大的家族健康史表示,而不会丢失数据,并与现有的家族健康史工具兼容。Phenopackets规范:Phenopackets是案例级表型数据交换的标准,可以与可以用本体术语和其他数据填充的“插槽”的分层结构进行比较为了最大化计算分析的效用,这些槽与任何预先存在的术语或本体兼容,例如用于人类疾病表型的人类表型本体、用于癌症的NCI词库、用于实验室结果的LOINC和用于疾病的MONDO该标准的模块化设计还通过将其集成到phenopack的结构中,实现了与互补的GA4GH可交付成果(如Pedigree和Variation Representation Specification(VRS))的互操作性基因组变异:开发了GA4GH变异表示规范(VRS)和变异注释(VA)框架,以解决用于访问参考基因组序列和基因组注释的各种方法(例如,基因、变异、调控区、表达)。关联的元数据通常可以是非结构化的。VRS和VA旨在以明确和语义严格的方式提供,共享和计算表示基因组变异信息。这些规范是根据健康7级(HL7)临床基因组学工作组的标准通过双向反馈制定的,该工作组支持使用电子健康记录(EHR)报告临床基因组学检测结果和相关信息。这些规范之间的一致性是支持跨临床-转化-研究范围的数据交换和系统互操作性的关键一步。插文2.GA4GH与现有标准一致的示例以及由此产生的数据的监管和传播,与研究相比,在医疗保健方面 可 能有 很 大 的 不同 。 32 , 33通 过 欧洲 基 因 组 - 表 型 数据 库(EGA)、日本基因型-表型数据库(JGA)或基因型和表型数据库(dbGaP)。世界各地的研究人员将利用这些公开共享的基因组数据集进行自己的研究,增加来自每个基因组的知识量。[34]然而,虽然这些研究基因组更容易获得,但这些数据集通常不包括基因组医学所需的纵向、标准化或可互操作的临床数据的类型或范围。35基于医疗保健的研究和测试具有完全不同的财务,法律和社会环境,其结构,规定和监管因国家而异,涵盖了从国营到私营计划的全部范围。7在每个系统中,医疗保健(包括基因组学)中检测的成本通常根据其对个人健康的益处和医疗保健系统中的成本效益来考虑。36.理论上,如果基因组测定证明了医疗保健系统中特定应用的临床实用性,特别是如果它具有成本效益,则其部署的唯一限制是可能受益的患者数量。然而,在实践中,在基因组测试成为常规临床提供之前,存在此外,获得医疗保健的障碍可能仍然是许多国家大规模实施的障碍。目前在医疗保健中实施基因组学的案例可以在四个广泛的疾病领域中呈现:罕见病、癌症、常见/慢性病和传染病。在下面的章节中,我们概述了医疗保健资助在每个疾病领域进行测序。我们还强调了每个领域的实施挑战以及旨在克服这些问题的GA4GH交付成果。罕见病可以说,罕见疾病领域已经见证了基因组学在医疗保健中最成功的部署,许多报告的诊断率至少为20%-30%,卫生经济研究证明了成本效益和诊断效用。自20世纪90年代初以来,临床遗传学家已经使用单基因或小基因面板测试来支持许多这些疾病的诊断和一些治疗决策。分析更广泛的基因组区域(包括外显子组和基因组测序)的成本已经大幅下降,对罕见病诊断和详细研究产生了重大影响。42,43然而,由于1万多种罕见疾病44影响着全世界3亿多患者,45诊断和发现其中许多疾病的治疗方法一直具有挑战性。因此,罕见病社区已经接受了数据共享,以促进全球知识交流,提高患者诊断率,了解疾病进展并增强护理策略。41为了进一步推动进展,临床和研究实验室以及卫生系统必须支持几项关键活动,以有效地识别、诊断并最终治疗罕见疾病的遗传原因:(1)聚合基因组和表型数据,用于识别疾病和非疾病人群中的人群等位基因频率,并在罕见疾病中发现新基因;(2)使用一致的注释模型和术语对基因-疾病关联的有效性进行编目;46(3)共同建立知识库,以了解变异致病性;(4)定义罕见疾病的自然史,以预测疾病进展,并为开展临床试验奠定基础;(5)监测治疗效果10细胞基因组学1,100029,2021会开放获取透视新兴疗法的一部分。GA4GH标准和政策已经支持并将继续建立在这些活动的基础上。例如,Matchmaker Exchange是一个罕见疾病基因发现平台,它受益于GA 4GH对基于API的数据交换格式的指导以及同意47和数据安全政策48,49-说明了将执业临床医生和研究人员聚集在一起的力量,因为来自全球各地的病例对于建立证据以确认新的基因-疾病关系是必要的。48GA4GH促进了ClinVar中的知识共享,ClinVar是一个加速了临床实验室社区变异分类改进的数据库。50目前正在部署其他方法,以超越将变异分类手动提交到中央数据库的做法;这些改进将使人们能够更及时地获得孤立的实验室知识和基于证据的变异分类。与ClinVar的实时共享-通过API和链接到丰富的病例级数据的条目来促进-将需要扩展我们对迄今为止在人类基因组中确定 的 超 过 7.5 亿 个 变 体 的 在 gnomAD 中 ; https : //gnomad.broadinstitute.org)上提供。变异表示(VRS)18和变异注释(VA)规范旨在支持变异数据、Phenopackets和谱系表示的交换,以支持标准化临床和家族史数据以及新API(例如,Beaconv2 API和Data Connect API),以识别数据,以便进一步访问和分析。这些标准的目的是支持一种更加全球化和联合的罕见病数据和知识共享方法,这对推进罕见病的诊断和治疗至关重要癌全世界五分之一的男性和六分之一的女性在一生中会被诊断[51]在资源丰富的国家,这种风险要高出2至3倍,[51]例如,在英国,估计每两个人中就有一个人患有这种疾病。52改变的体细胞基因组是癌症的一贯标志,通常与特定的致病突变有关。53.在一些患有遗传性癌症综合征的个体中,生殖系变异可以破坏癌症相关途径,并增加发展为“可遗传”恶性肿瘤的风险54-57、58肿瘤/正常测序已被证明在疾病监测59以及诊断、60预后、61和治疗反应预测62中的应用,无论是在初始表现63还是疾病复发中。64癌症基因组学在临床上的应用比罕见病更复杂。对于癌症患者,治疗策略时间框架通常以周为单位测量,并且在如此紧急的周转时间内整合基因组信息在逻辑上具有挑战性,难以整合到临床决策中。65此外,虽然使用基因组学进行诊断和改善症状管理可以为罕见病患者及其家属带来实质性改善,但基因组学在癌症治疗中的应用更为复杂,可能包括体细胞和生殖细胞基因组的双重评估以确定遗传性癌症风险和评估由于靶向治疗而改变的选择压力而导致的肿瘤基因组演变。如果癌症基因组信息能为治疗方案提供信息,那么它是最有用的,但是需要开发将患者与适当的临床试验相匹配的系统,以充分实现基因组肿瘤数据的益处,其中癌症患者的临床试验招募估计占8%左右。66基因组信息越来越重要通过常规临床测序分析和分子肿瘤板。癌症作为一种疾病的异质性--每个个体肿瘤和任何为了解决这一复杂性,重要的是要一起分析体细胞和生殖细胞变异数据,以了解它们对癌症风险的贡献。69对于罕见疾病重要的大多数相同标准和工作流程适用于肿瘤测序,包括数据存储和压缩标准(例如,CRAM)、变化表示(例如,VCF和VRS)、分析(例如,基于云的工作流),以及与患者记录的链接(例如,Phenopackets)。然而,致癌驱动突变的发现还需要显著的协调和标准化来跟踪结果数据(例如,进展和对治疗的反应),这是确定在癌症患者中发现的变异的临床意义的关键因素70因此,许多小组已经创建了知识库,以注释与致病性证据或相关治疗方案相关的癌症基因组变异;然而,这些知识库的互操作性水平有限。2014年,GA4GH任务小组启动了癌症变异解释联盟(VICC),该联盟负责协调和协调临床体细胞癌治疗工作,并创建了一个开放的社区资源来提供汇总信息。71展望未来,主要的癌基因组资源现在正在与GA4GH合作,通过改进和采用Beacon API、数据使用本体(DUO)、9VA和VRS等标准,协调变异解释证据。此外,这些标准正在多个GA 4GH驱动项目(见表2)中实施,这些项目在癌症的纵向演变常见/慢性疾病“常见病”是一个概括性的短语,描述了具有复杂的环境和遗传病因的疾病的巨大光谱。从遗传学角度准确预测常见疾病一直是人类遗传学研究的一个主题,但基因组信息在临床实践中尚未得到广泛应用。大量遗传易感基因座(多基因结构)的发现支持常见疾病常见变异假说72,
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 十种常见电感线圈电感量计算公式详解
- 军用车辆:CAN总线的集成与优势
- CAN总线在汽车智能换档系统中的作用与实现
- CAN总线数据超载问题及解决策略
- 汽车车身系统CAN总线设计与应用
- SAP企业需求深度剖析:财务会计与供应链的关键流程与改进策略
- CAN总线在发动机电控系统中的通信设计实践
- Spring与iBATIS整合:快速开发与比较分析
- CAN总线驱动的整车管理系统硬件设计详解
- CAN总线通讯智能节点设计与实现
- DSP实现电动汽车CAN总线通讯技术
- CAN协议网关设计:自动位速率检测与互连
- Xcode免证书调试iPad程序开发指南
- 分布式数据库查询优化算法探讨
- Win7安装VC++6.0完全指南:解决兼容性与Office冲突
- MFC实现学生信息管理系统:登录与数据库操作
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功