没有合适的资源?快使用搜索试试~ 我知道了~
远程可视化基因组比对:协同临床研究和诊断
技术远程可视化大规模基因组比对,用于罕见病的协同临床研究图形摘要亮点d序列比对的可视化使得能够评估基因组变体dRD-Connect GPAP用户可以通过GA 4GH htsget在EGA可视化比对d实时远程可视化避免了经常性的大量数据下载d在Solve-RD项目中检查了数百种罕见的致病变异作者AlbertoCorvo`,LeslieMatalonga,Dylan Spalding,.,Thomas Keane,Davide Piscia,Sergi Beltran对应sergi. cnag.crg.eu简言之Corvo'etal. 提出了一个GA 4GHhtsget实现,使RD-Connect GPAP用户能够在EGA实时远程可视化基因组比对,避免了大量下载的需要。事实证明,这对于评价Solve-RD项目中数百名患者的潜在罕见Corvo'etal.,2023,细胞基因组学3,1002462023年2月8日,作者。https://doi.org/10.1016/j.xgen.2022.100246会会开放获取技术远程可视化大规模基因组比对,用于罕见病的协同临床研究和诊断AlbertoCorvo`,1,10LeslieMatalonga,1,10DylanSpalding,2,3AlexanderSenf,2,4StevenLaurie,1DanielPico'-Amador,1Marcos Fernando-Callejo,1Ida Paramonov,1Anna Foix Romero,2Emilio Garcia-Rios,2JorgeIzquierdo Valencia,2AnandMohan,2ColineThomas,2AndresFelipe Silva Valencia,2CsabaHalmagyi,2MalloryAnnFreeberg,2AnaTopf,5Rita Horvath,6Gary Saunders,7Ivo Gut,1Thomas Keane,2Davide Piscia,1and Sergi Beltran1,8,9,11,*1CNAG-CRG,Centre for Genomic Regulation(CRG),The Barcelona Institute of Science and Technology,BaldiriReixac 4,巴塞罗那08028,西班牙2欧洲分子生物学实验室,欧洲生物信息学研究所,英国3CSC,埃斯波,芬兰4AI-Digital,林肯,英国5约翰·沃尔顿肌营养不良症研究中心,转化和临床研究所,纽卡斯尔大学和纽卡斯尔医院NHS基金会信托,泰恩河畔纽卡斯尔,英国6英国剑桥大学剑桥生物医学校区临床医学院John Van Geest脑修复中心临床神经科学系7ELIXIR Hub,Wellcome Genome Campus,Hinxton,Cambridge,UK8Universitat Pompeu Fabra(UPF),巴塞罗那,西班牙9Departament de Gene`tica,Microbiologia i Estad ′ ıstica,Facultat de Biologia,Universitat de Barcelona(UB),08028 Barcelona,Spain10作者贡献相等11引线触点* 通信:sergi.cnag.crg.euhttps://doi.org/10.1016/j.xgen.2022.100246总结Solve-RD项目的目标包括通过对共享基因组-表型组数据集的合作研究来解决未诊断的罕见疾病(RD)。用于数据整理和分析的RD-Connect Genome-Phenome Analysis Platform(GPAP)和用于文件存储的European Genome-Phenome Archive(EGA)是Solve-RD基础设施的两个关键组成部分临床研究人员可以识别RD-Connect GPAP中的候选遗传变异,并且由于这里作为联合ELIXIR活动的一部分所展示的发展,能够远程可视化存储在EGA中的相应比对全球基因组学与健康联盟(GA4GH)htsget流式传输应用程序编程接口(API)用于检索比对切片,比对切片由嵌入GPAP中的集成基因组查看器(IGV)实例呈现因此,超过11,000个数据集不再需要下载大型对齐文件以在本地对其进行可视化这项工作突出了优势,从用户和基础设施的角度来看,实施互操作性标准,建立联合基因组数据网络。介绍下一代测序(NGS)允许对外显子组和基因组进行具有成本效益的测序,从而促进临床研究和诊断,超过几年前的可能性。尽管如此,这些技术仅能够对疑似单基因罕见病(RD)患者的诊断率在20%至60%之间,具体取决于基础疾病。2Solve-RD(http://solve-rd.eu/)是一项泛欧洲倡议,旨在揭示未诊断RD的分子原因。5.该项目的主要目标之一是全面重新分析来自欧洲参考网络(ERN;https://ec.europa.eu/health/ern_en)和西班牙和意大利未确诊疾病项目的未确诊患者的19,000多个不确定的外显子组和基因组。因此,Solve- RD面临的主要挑战之一是在安全和协作的环境中有效收集、存储、处理、共享和解释欧洲超过51个不同中心提供的大量数据的能力。为了应对这一挑战,Solve-RD基础设施建立在现有资源和技术的基础上,例如欧洲基因组-表型组档案(EGA)6和RD-连接基因组-表型组分析平台(GPAP)7,每个都由几个欧洲和国家项目资助。特惠津贴CellGenomics 3,100246,February 8,2023?作者。1这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。会开放获取技术2Cell Genomics3,100246,2023和 RD-ConnectGPAP 得 到 了 ELIXIR ( https : elixir-europe.org/)的支持,ELIXIR是一个汇集欧洲各地生命科学资源 的 政 府 间 组 织 , 也 是 欧 洲 罕 见 疾 病 联 合 计 划(https://www.ejprarediseases.org/)的关键,该计划涉及所有ERN。Solve-RD使用RD-Connect GPAP作为表型和基因组数据输入点,使用EGA进行永久数据存储和重复使用。EGA和RD-Connect GPAP均对Solve-RD项目之外的临床科学家开放注册用户能够提交和访问数据,为临床科学家提供共享和分析RD患者的综合基因组和表型数据的功能,目的是识别未诊断患者的致病遗传变异或发现新的基因-疾病关联。EGA(https://ega-archive.org/)是一项永久存档和共享生物医学研究项目产生的个人可识别遗传和表型数据的服务。EGA为获得批准的研究人员提供访问权限,以促进数据的重复使用,实现可重复性,并加速生物医学和转化研究,符合可发现,可解释,可互操作和可重复使用(FAIR)原则。8EGA已经存档了4,500多项研究,这些研究代表了来自各个研究领域的遗传、表型和临床数据,其中包括200个RD中的900多项研究。研发数据由研究特定疾病的单个实验室以及大型研发计划(如Solve-RD、国家卫生与护理研究所(NIHR)和BioResource RareDiseases BRIDGE联盟(https:bioresource.nihr.ac.uk/))提交给EGA,该联盟是13个罕见疾病项目之间的合作,旨在发现未解决的遗传性疾病的遗传原因授权的研究人员可以访问EGA并将数据下载到他们的计算机或安全的数据分析平台。我们的工作还通过远程访问基因组比对文件的特定区域来避免下载数据的需要。RD-Connect GPAP(https://platform.rd-connect.eu)是国际罕见疾病研究联盟(IRDiRC)认可的资源和隐私保护环境,用于安全的数据分析。该平台为临床科学家提供了一个框架,用于处理、分析和共享来自RD患者的整合测序和表型数据,和他们的亲属,通过一个强大的和用户友好的界面诊断和基因发现。RD-Connect GPAP使用户能够根据测序覆盖率和变体质量、遗传模型、已知效应、预测致病性、群体频率、疾病和表型关联等,从外显子组和基因组中筛选遗传变体并对其进行优先排序。与多个外部网络服务的连接以及与大量网站的链接有助于解释筛选的变体。该平台还使研究人员能够寻找患有相同疾病的其他患者或相同基因中的候选变体,使研究人员能够接触并分享更多细节。RD-Connect GPAP还连接到MatchMaker Exchange网络9,该网络允许仅在其中一个节点中注册的用户在网络的其他节点中寻找具有相似表型和候选基因的患者的RD-Connect GPAP目前拥有来自授权用户提交的26,500多名患者和亲属的表型和处理的基因组数据(注释的遗传变异)。基 因 组 数 据 以 最 常 见 的 文 件 格 式 提 交 : 二 进 制 比 对 图(BAM),压缩的参考定向比对图(CRAM)或FASTQ,一种基 于 文 本 的 格 式 。 RD-Connect GPAP 不 会 将 基 因 组 比 对(BAM/CRAM)存储在其在线服务器上,因为这些文件非常大,而EGA等其他服务更适合此目的。在授权后,RD-ConnectGPAP可以将相应的原始比对和遗传变异文件(FASTQ和/或BAM/CRAM和变异调用格式[VCF])、表型信息和文件的元数据传输到EGA,以进行长期受控访问和数据重复使用。然而,临床科学家必须能够获得基因组比对,以可视化候选致病变异体周围的区域。尽管识别遗传变体的算法通常是高度准确的,但是存在基因组的许多区域,其中从NGS数据检测变体仍然具有挑战性。[10]在基因组的重复区域尤其如此,在这些区域中,正确识别短插入、缺失和拷贝数变异更具挑战性;事实上,已经有400多个医学相关基因受到这些问题的影响尽管如此,即使是未经训练的眼睛也可以在检查比对本身的区域时立即识别这些变体是否不可靠。然而,每次研究人员想要可视化特定的基因组基因座时,必须从远程源下载/传输千兆字节的数据既不高效也不可扩展。出于这个原因,全球基因组学与健康联盟(GA4GH)开发了htsget流式传输应用程序编程接口(API),该接口允许用户以标准化、安全和实时流式传输的方式请求和接收基因组数据。12设计为了使RD-Connect GPAP的用户能够从EGA存档的数据中可视化基因组比对,我们在ELIXIR的背景下开发了一个可扩展的系统 , 包 括 ELIXIR 罕 见 疾 病 社 区 ( https://elixir-europe.org/communities/rare-diseases),ELIXIR联合人类数据社区(https://elixir-europe.org/communities/human-data)和Solve- RD。该系统使用GA4GH htsget流式传输API12来请求和检索在EGA处存档的基因组数据,并且使用嵌入在RD连接GPAP中的整合基因组学查看器(IGV)13的实例来呈现比对。总体实施目前使RD-Connect用户能够远程访问并可视化通过Solve-RD项目提交的患者和亲属的11,750个数据集,该项目已在数百例RD病例中识别出致病变异5、14-18EGA的数据提交和存储授 权 用 户 向 RD-ConnectGPAP ( https://platform.rd-connect.eu/ ) 提 交 原 始 基 因 组 数 据 ( FASTQ ) 。 根 据 RD-Connect GPAP行为准则和Solve-RD数据共享政策的要求,数据分包商负责检查数据是否适合 提交给RD-Connect GPAP和Solve-RD。使用标准化Cell Genomics3,100246,2023年2月8日3会开放获取技术分析管线9,并可用于RD-Connect GPAP内的下游分析和解释在用户授权后,原始未映射文件(FASTQ和/或BAM/CRAM)连同其相应的索引文件、分析就绪比对(BAM/CRAM)和相应的索引(BAI和CRAI文件)、表型信息(Phenopackets,http://phenopackets. org/)、遗传变体文件(VCF)、谱系文件(PED)和Meta数据(CSV)使用EGACryptor(https://ega-archive. org/submission/tools/egacryptor)。加密文件通过EGA服务 器( https://ega-archive.org/submission/tools/ftp-aspera)上 传 到 EGA , 并 按 照 标 准 协 议 ( https : //ega-archive.org/submission/quickguide)上传到特定的RD-ConnectGPAP盒中。相应的元数据通过标准机制使用EGA子目录门户( https://ega-archive.org/submission/tools/submitter-portal ) 提交。RD-Connect GPAP盒的创建得到了RD-Connect数据访问委员会(DAC)的批准。提交给EGA的数据将永久存档,以便受控访问和重复使用。安全访问的数据存档在的RD-Connect GPAP的EGA注册受DAC和行为准则(https://platform.rd-connect.eu/gpap_doc/)监管。数据访问仅限于注册用户,身份验证由使用OpenID Connect协议的开源身份和访问管理解决方案(KeyCloak,https://www.keycloak.org/)管理当请求访问EGA存档的实验数据时,RD-Connect GPAP的相同权限适用于每个用户然后,来自RD- Connect GPAP的超文本传输协议(HTTP)GET请求被发送到内部Python-Flask微服务,该微服务验证用户的凭证和访问所请求文件的权限。如果许可被授予,则系统将所请求的信息(文件标识符和基因组间隔)发送到EGA服务器。分割和传输EGA存档的数据通 过 EGA 数 据 下 载 服 务 的 GA4GH htsget API 实 现(samtools.github.io/hts-specs/htsget.html),从EGA存档的文件中实现实时基因组数据切片该协议使用行业安全标准OAuth2.0令牌来安全地授权数据请求(tools.ietf.org/html/rfc6749)。GA4GH htsget的底层API是由EGA开发和维护的一组核心微服务,该服务自2019年以来一直在生产通过htsget协议,请求的数据以二进制格式返回,由Python-Flask API发送到RD- ConnectGPAP客户端。RD-Connect GPAP中的基因组数据可视化和探索RD-Connect GPAP平台构建为服务器-客户端架构,用户可以访问该架构以提交临床数据或实验和文件元数据,或通过强大的用户界面分析参与者将来自IGV(IGV.js,MIT,MA,USA)的JavaScript库嵌入到RD-Connect GPAP环境中以实现基因组比对的可视化(https://platform.rd-connect.eu/igvgpap/)。IGV.js包括可视化、探索和导航基因组区域。IGV浏览器读取二进制BAM文件。读取比对在专用模 块 中 呈 现 , 并 根 据 参 考 序 列 ( RefSeq ) 数 据 库(https://www.ncbi.nlm.nih.gov/refseq/)映射到基因。该系统目前支持GRCh37作为参考基因组,但可以与任何版本的基因组一起工作。可以通过水平和垂直滚动视图来浏览路线。如上所述,改变预先选择的基因组间隔触发新的结果基因组数据工作流程、存储和权限访问根据EGA标准方案(https://ega-archive.org/submission/quickguide)组织基因组比对的提交和存档(BAM通过单个EGA用户配置文件进行用户认证,以访问由RD- Connect GPAP提交给EGA因此,RD-Connect GPAP根据行为准则和前者的数据访问政策控制谁可以访问EGA的路线。RD-Connect GPAP中的用户身份验证由OpenID Connect管理。如果获得许可,则数据的访问和检索将由EGA服务器使用GA4GH Directory和Streaming API开发的安全htsget API进行管理(图1)。EGA服务器允许以1个字节的块查询基因组切片通过RD-Connect GPAP用户界面,从EGA存档的数据中可视化基因组比对和覆盖率为了在RD-Connect GPAP中可视化比对和覆盖信息,我们开发了基因组浏览器模块,其包括嵌入式IGV。该模块目前可供所有注册用户访问(图1),他们可以通过两种不同的方式请求第一种是点击GPAP中显示的每个过滤的遗传变异的两个IGV标记的链接之一 这两个连接分别在变体位置±10 bp或±1 Kbp处打开嵌入的 IGV中的 比对 。第二 种方 法是打 开基 因组浏 览器 模块PAGE,并使用实验代码和染色体坐标完成表格。这两个选项允许用户不仅可视化在RD-Connect GPAP中优先化的变体,例如单核苷酸变体(SNV)/插入或缺失(indel)和拷贝数变体(CNV),而且还可视化其他类型的候选变体,包括可能已经在GPAP外部鉴定的大重排断点。完整的实现可以在视频S1中查看。所使用的GA4GH htsget方案和IGV文库还支持来自单个比对的特定信息的切片和呈现,包括链类型、映射质量、配对映射、插入大小和碱基质量,当用户选择其中一个读数时,这些信息可供用户使用。用户可通过嵌入式IGV应用程序获得此信息,该应用程序还提供了增强用户体验的几个选项。这些增强包括通过读取链着色,显示软片段和三种可能的氨基酸翻译,标记4Cell Genomics3,100246,2023会开放获取技术图1.远程实时可视化工作流(A和B)RD-Connect GPAP授权用户(A)识别感兴趣的变体,并通过(B)点击界面中提供的IGV链接请求可视化相关的基因组比对(C)请求被发送到EGA,EGA将访问引导到相应的EGA框和对齐文件(BAM/CRAM)。(D和E)htsget协议生成所请求的对齐的切片作为应答(D),其由RD连接GPAP(E)中的IGV应用实现呈现。(F)用户能够可视化感兴趣区域中的对准感兴趣的特定读段,显示所有碱基等。在时间方面,对于±20 bp查询,访问外显子组或基因组区域并从RD-Connect GPAP内的实验呈现相应比对所需的平均总时间为23.84 s(标准差[SD] =8.54 s,min = 6.45 s,max = 43.63 s),对于±1 Kbp查询为25.92 s(SD = 10.64 s,min = 6.44 s,max = 102.07 s;表S1该系 统是 可靠 的, 因为 我们 只有 一个 失败 的864 个 测试 请求(99.88%的比对的可视化以确认所谓的遗传质量变体内的Solve-RD项目对所描述的工作流程进行了测试,并使用来自Solve-RD项目的11,750个数据集进行了规模化生产。将Solve-RD BAM文件提交至专用EGA箱,并使GPAP用户可访问,以通过GA 4GH htsget方案可视化基因组的选定亚部分。该项目的临床科学家现在可以访问此功能,使他们能够直观地验证致病变异。对首批4,400例Solve-RD病例的初步图2和视频S1显示了一个基因组比对的可视化示例,一名小脑发育不良和脊髓性肌萎缩症患者TRIP4的阳性纯合子变体18讨论实时访问基因组比对是必要的,以允许临床科学家在解释他们的数据以确认候选变体的质量时可视化感兴趣的区域和/或变体。在此,我们报告了一种创新且强大的解决方案,该解决方案能够直接在嵌入RD-Connect GPAP接口的IGV实例中可视化在EGA处远程存档的基因组比对的特定区域。与RD-Connect GPAP类似的举措,例如使用基因组资源的人类基因组变异和表型数据库(DECIPHER),使得能够在基因组浏览器中可视化具有预加载的轨道(例如,基因组聚合数据库[gnomAD]、临床基因组[ClinGen]资源、其他DECIPHER致病变体),但不允许可视化来自特定个体的特定基因组比对。我们的实现使得(1)能够从已解决的案例中检查致病变体并将其与正在调查的当前案例进行比较,以及(2)能够在检测到致病变体的情况下,Cell Genomics3,100246,2023年2月8日5会开放获取技术图2.在EGA存档的基因组比对切片的可视化GPAP的嵌入式IGV的屏幕截图显示了一个基因组数据显示在位置15处的纯合单核苷酸变化:64698591C>T(NM_016213.5:c.760C>T [pArg254Ter])。据报道,这种变异是致病的。18用于解释目的的基因组变体或感兴趣区域的研究,如图2所示。GA 4GH htsget API是实现的关键组件,可实现特定比对区域的流式传输,因此临床科学家无需在中心、系统和/或合作伙伴之间下载或传输完整比对文件,现有解决方案包括文件传输协议(FTP)、FTP或Globus。12在EGA实施htsget API时遇到了一些相关的挑战。其中之一是htsget API与旧版本的BAM文件和压缩对齐(CRAM文件)不兼容。这已经在新版本的htsget API中解决了,它与旧版本的BAM文件合并了向后兼容性,并添加了直接访问CRAM文件的功能。另一个挑战是结合特定比对区域的解密,因为EGA中的数据在静止时被加密存储,并且必须被解密才能对临床科学家有用这通过在向用户提供数据的过程中实施解密步骤来解决;使用块密码对数据进行加密的事实意味着可以仅检索和解密与所请求的比对区域相关的块,而不需要解密整个文件。所描述的实现已经用来自Solve-RD的11,750个数据集进行了测试,使该项目的120多名用户能够实时访问和可视化这些信息,并有助于解决数百名以前未诊断的患者。5,15这是第一个演示第三方系统(如RD-Connect GPAP)如何访问和呈现(经授权)在EGA存档的数据,而无需完整下载相应的文件相同的方法将在Solve-RD中用于其他类型的组学数据,如转录组学,以可视化RNA测序(RNA-seq)比对和相应的变体、生鱼片图和剪接点。htsget功能是组成EGA数据下载API的许多组件中的一个,还有处理身份验证、授权等的组件。与任何生产服务一样,整个API的稳定性取决于许多方面,例如底层基础设施的稳定性,托管机构的共享资源,用户的活动模式以及自然行为。类似地,有许多方法可以缓解不稳定性问题,包括故障转移基础设施,监控和审计服务使用情况,以及开发强大的服务,当他们遇到问题时,为用户优雅而透明地处理它们作为一个示例,EGA数据下载API为用户自动实现重试,并且如果用户的连接中断,它还可以从中断的地方重新开始数据传输GA4GH htsget协议之前已经由一组人类数据的研究和商业提供 商 使 用 公 共 三 人 组 数 据 集 12 进 行 演 示 , 并 由 GenomicsEngland在其本地集群中提供来自100,000个基因组计划我们的方法超越了当地环境,并展示了连接和联合安装在不同国家和不同机构下的该模型向联合方法(联合EGA和/或联合RD-ConnectGPAP实例)的可扩展性对于大型项目和计划(如欧洲1+ MillionGenomes计划(https://digital-strategy.ec.europa.eu/en/policies/1-million-genomes))是可行的,但需要实施更复杂的用户身份验证和授权6Cell Genomics3,100246,2023会开放获取技术过程其他GA4GH标准,例如GA4GH护照(http://bit.ly/ga4gh-passport-v1#passport)和认证&授权基础设施(AAI)规范(http://bit.org)。LY/GA 4GH-AAI-profile)对于这些目的将可能是有用的,因为这些标准联合工作以便可靠地认证研究人员的数字身份并使他们对所请求的基因组数据集的总之,我们已经开发出一种强大且可扩展的解决方案,使临床科学家能够可视化远程存储的基因组比对数据,用于临床研究和诊断。这种实施方式已经证明对于确认具有先前未诊断的RD的患者的候选变体的质量我们的工作突出了开发和实施互操作性标准的影响,这对于建立大型联合基因组数据网络至关重要。限制我们的研究设计在报告渲染性能时面临两个主要限制。第一个是,尚未测试从存储在不同EGA框中的文件渲染比对时的性能,第二个是我们的方法专注于基因组比对的可视化,并且不评估使用来自其他类型的组学数据(如转录组学)的类似格式的性能。STAR+方法本文件的在线版本提供了详细的方法,包括以下内容:d关键资源表d资源可用性B电极导线触点B材料供应情况B数据和代码可用性d方法样本d量化和统计分析补充信息补 充 信 息 可 以 在 www.example.com 上 找 到 https://doi.org/10.1016/j 。xgen.2022.100246。致谢作者要感谢ELIXIR罕见病社区、ELIXIR联合人类数据社区和GA4GH htsgetAPI 工 作 组 的 支 持 和 富 有 洞 察 力 的 讨 论 。 作 者 还 想 感 谢 Solve-RD ERN(EQUACA,RND,EURO-NMD和GENTURIS),Solve-RD数据分析工作组和Solve-RD基础结构工作包成员对用例的建议,测试系统并提供反馈。本研究部分由ELIXIR实施研究“EGA ELIXIR中存储的人类RD基因组数据的远程实 时 可 视 化 ( RD-Connect ) ” ( 2017-2018 ) 、 “ELIXIR 罕 见 疾 病 活 动 中ELIXIR-IIB的整合(2017-2018)”和“罕见疾病基础设施ELIXIR(2019-2020年)”以及Solve-RD项目资助,该项目获得了欧盟地平线2020研究和创新计划的资助,资助协议编号为779257。使用RD-Connect基因组-表型组分析平台分析数据,该平台已收到来自欧盟项目RD-Connect、Solve-RD和EJP-RD的资金(赠款编号:FP7305444、H2020 779257和H2020 825575)、卡洛斯三世健康研究所(授权号:PT 13/0001/0044和PT 17/0009/0019;国家生物信息研究所,INB)和ELIXIR实施研究。我们感谢西班牙经济、工业和竞争力部(MEIC)对EMBL伙伴关系、Centro de Excelsio Severo Ochoa和CERCA计划/加泰罗尼亚政府的支持。我们还感谢加泰罗尼亚政府通过卫生部和企业和咨询部提供的支持,以及西班牙经济、工业和竞争力部(MEIC)与欧洲区域发展基金(ERDF)共同提供的资金,这些资金与2014- 2020年智能增长运营计划相作者贡献A.C.对开发和手稿写作做出了贡献; L.M.参与研究设计和手稿撰写; D. S.参与研究设计; A.S.,D.P.-一、和D. P.为技术实施做出了贡献; S.L.参与手稿写作;M.F.- C.和I. P.参与了Solve-RD数据处理和提交; A.F.R.,例如- R.,上午,和A. F. S. V.对软件实现和测试做出了贡献; C.H.和J.I.C.有助于开发和设计; C.T.协助提交数据; M.A.F.,TK和S.B. 有助于协调、研究设计和手稿撰写; A.T.和R.H.有助于用例;和G.S.和I.G.有助于协调。所有作者均审查了手稿。申报利益作者声明他们没有利益冲突。投稿时间:2021 - 11 -修订日期:2022受理时间:2022发布时间:2023引用1. Boycott,K.M.,哈特利,T.,Biesecker,L.G.,吉布斯,R.A.,Innes,上 午 , Riess , O. , Belmont , J. , Dunwoodie , S.L. Jojic , N. ,Lassmann,T.,等(2019)。所有罕见遗传疾病的诊断:地平线和下一个前沿。177号房32-37 https://doi.org/10.1016/j.cell.2019.02.040网站。2. Farwell,K. D.,沙赫米尔扎迪湖El-Khechen,D.,Powis,Z.,Chao,E.C.,蒂普-平戴维斯,B.,Baxter,R. M.,曾伟,Mroske,C.,Parra,M.C.,等人(2015年)。以家族为中心的诊断性外显子组测序与基于遗传模型的分析的增强效用:来自500个患有未诊断遗传疾病的家系的结果Genet. 17,578-586。网址://doi. org/10.1038/gim.2014.154。3. 斯 塔克 ,Z. , Tan , T.Y. ,Chong , B., 布雷 特, G.R. ,Yap , P.,Walsh,M.,Yeung,A.,彼得斯,H.,Mordaunt,D.,Cowie,S.,等人(2016年)。全外显子组测序作为疑似单基因疾病婴儿的一线分子检测的前瞻性Genet.Med.18,1090-1096.网址:http://doi.org/10.1038/gim.2016.14. Wright,C.F.,菲茨杰拉德,T.W.,琼斯,W.D.,Clayton,S.,麦克雷, J.F. ,van Kogelenberg ,M. ,金 ,地 方检 察官 安布 里奇 ,K.,Barrett,D.M.,Bayzetinova,T.,等(2015年)。DDD研究中发育障碍的遗传诊断:全基因组研究数据的可扩展分析Lancet385,1305-1314.https://doi.org/10.1016/S0140-6736(14)61705-0.5. Zurek , B. , Ellwanger , K. , Vissers , L.E.L.M. ,Schuele , R. ,Synofzik,M., 托 普 夫,A.,de Voer,R.M.,Laurie,S.,马塔隆加湖Gilissen,C.,等; Solve-RD联盟(2021年)。Solve-RD:系统的泛欧数据共享和协作分析,以解决罕见疾病。EUR. J.哈姆。Genet. 29,1325-1331. https://doi.org/10.1038/s41431-021-00859-0网站。6. Freeberg,MA,来自洛杉矶的弗罗蒙特D'Altri,T.,罗梅罗,A.F.,J.I.,Jene ,A. , Kerry , G. ,Moldes , M. , 阿 里 奥萨 河 Bahena , S. , 等(2022年)。2021年的欧洲基因组表型组档案。Nucleic AcidsRes.50,D980- D987. https://doi.org/10.1093/nar/gkab1059网站。Cell Genomics3,100246,2023年2月8日7会开放获取技术7. Lauri e,S.,Piscia,D.,马塔隆加湖 C orvo',A., Fern a'n ez-Callejo,M.,Garcia-Linares,C.Hernandel-Ferrer,C.,Luengo角,马丁内斯岛帕帕-康斯坦丁努,A.,等人(2022年)。RD-Connect基因组-表型分析平台:加速罕见疾病的诊断、研究和基因发现。Hum.穆塔43,717-733。https://doi.org/10.1002/humu的网站。243538. 威尔金森,医学博士,Dumontier,M.,Aalbersberg,I.J.J.,阿普尔顿,G.,Axton,M.,Baak,A.,Blomberg,N.,Boiten,J.W.,da SilvaSantos,L.B.,伯恩体育等人(2016年)。FAIR科学数据管理和监督指导原则Sci.数据3,160018。https://doi.org/10.1038/sdata.2016.18.9. Philippakis,A.A.,Azzariti,D.R.,Beltran,S.,布鲁克斯,A.J.,布朗斯坦,CA,Brudno,M.,Brunner,H. G.,Buske,O. J.,Carey,K.,多尔,C.,等(2015年)。Matchmaker Exchange:罕见病基因展示平台。Hum.穆塔36,915-921。https://doi.org/10.1002/humu.22858网站。10. Laurie,S.,Fernando-Callejo,M.,Marco-Sola,S.,Trotta,J.R.,坎普斯,J.,Chaco 'n,A.,Espinosa,A.,Gut,M.,古特岛,希思,S.,和Beltran,S.(2016年)。从湿实验室到变化:全基因组和全外显子组测序的生物 信息学管道的 一致性和速度 。Hum. 穆塔37 ,1263-1271。https://doi.org/10.1002/humu.23114网站。11. 瓦格纳,J.,奥尔森,北卡罗来纳州,哈里斯湖,McDaniel,J.,郑洪,丰玉先生,A.,Hwang,Y.C.,古普塔河,温格,上午,Rowell,W.J.,等人(2022年)。为挑战医学相关的常染色体基因而策划的变异基准。国家生物技术40,672-680. https://doi.org/10.1038/s41587-021-01158-1.12. Kelleher , J. , 林 , M. , Albach , C.H. , Birney , E. , 戴 维 斯 河 ,Gourtovaia , M. , Glazer , D. , Gonzalez , C.Y. , 杰 克 逊 , D.K. ,Kemp,A.,等; GA4GH流任务团队(2019)。htsget:一种用于安全地流 式 传 输 基 因 组 数 据 的 协 议 。 Bioinformatics35 , 119-121.https://doi.org/10.1093/bioin-formatics/bty492.13. 罗宾逊,J.T.,Thorvaldsdo 'ttir,H.,Winckler,W.,Guttman,M.,Lander,E.S.,Getz,G.,Mesirov,J.P.(2011).综合基因组学查看器。国家生物技术29,24-26。https://doi.org/10.1038/nbt.1754网站。14. de Boer,E.,Ockeloen,C.W.,马塔隆加湖霍瓦特河Solve-RD SNV-indel工作组; Rodenburg,R. J.,Coenen,M.J.H.,Janssen,M.,Henssen,D.,Gilissen,C.,Steyaert,W.,帕拉莫诺夫岛Solve-RD-DITF-DITACA; Trimouille , A. , Kleefstra , T. , Verloes , A. , 和Vissers,L.E.L.M.(2021年)。一种通过全外显子组测序在智力残疾、癫痫和痉挛性四肢轻瘫患者中鉴定的MT-TL 1变体EUR. J.哈姆。Genet.29,1470-1471. https://doi.org/10.1038/s41431-021-00937-315. 马塔隆加湖Herna 'noung-Ferrer,C.,Piscia,D.,Solve-RD SNV-indel工作组;Sch
下载后可阅读完整内容,剩余1页未读,立即下载
![application/x-rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)