没有合适的资源?快使用搜索试试~ 我知道了~
循环DNA片段组学:癌症筛查与技术发展
会开放获取审查循环DNA片段组学与癌症筛查A.R. Thierry1,*1IRCM,Institut de Recherche en Cance 'rologie de Montpellier,UNIVERSITE' de Montpellier U1194,and ICM,Institut regional duCancer de Montpellier,Montpellier 34298,France* 通讯地址:alain. inserm.frhttps://doi.org/10.1016/j.xgen.2022.100242总结核循环DNA(cirDNA)的高度片段化依赖于染色质组织和单核体内的保护或包装,单核体是血流中最小和最稳定的结构不同大小模式的检测,称为片段组学,利用有关DNA核小体包装的信息。片段组学不仅涉及大小模式表征,还考虑核小体的定位和占据,这导致cirDNA片段被保护并持续存在于循环中。片段组学可以确定起源组织并区分癌症来源的cirDNA。在组学时代,片段组学的筛选能力得到了极大的加强,这一点在机器学习辅助的尖端技术的不断发展中得到了体现因此,片段组学可以被视为表征个体内癌症的策略,并为突变搜索、甲基化或核小体定位提供替代或协同补充。因此,它为改善诊断和癌症筛查提供了潜力。介绍片段组学是研究循环DNA(cirDNA)的一个新领域Ivanov等人1首次使用该术语来指cirDNA片段大小分布图的研究。片段组学(fragmentomics)一词最初由Za myatnin2提出,指的是对一组分子片段的结构和功能的研究;将整个生物分子片段集称为“片段组”。对于某些蛋白质,已详细研究了片段的拼接,确定了与特定蛋白质片段结构相关的功能。关于cirDNA在肿瘤学研究中的应用,需要研究cirDNA序列作为伴随测试的潜在应用,特别是用于靶向治疗。3五、九、十当在血液中检测到cirDNA时,DNA分子被高度片段化 1115-cirDNA相关片段组学可以涉及非测序技术、测序或两种方法的混合。癌症cirDNA拓扑学的表征受益于对来自健康受试者的cirDNA进行的工作(特别是在非侵入性产前测试[NIPT]的开发期间),特别是Denis Lo15,21-11-来自健康个体和癌症患者的cirDNA片段大小分布的差异。触须DNA显示染色质组织模式非组学观察cirDNA的一部分由细胞死亡期间释放的细胞外DNA组成,特别是在坏死、吞噬或凋亡期间。大于10,000个碱基对(bp)的33-37-39 DNA核小体片段化是细胞凋亡的标志。因此,DNA片段大小的分析可以使cirDNA的来源被辨别。对cirDNA的早期研究利用凝胶电泳,38并将cirDNA描述为由大约100-500 bp的片段组成Lo的研究小组19使用qPCR分析法分析了母体血浆中母体和胎儿DNA的大小分布,引物组扩增105至798 bp的序列,从而实现更精确的他们认为然而,巢式qPCR系统方法(N-qPCR)显示1112 ,13该观察结果增强了ctDNA的再加工,用于临床实施。41Cell Genomics3,100242,January 11,2023< $2022作者。1这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。会开放获取审查2Cell Genomics3,100242,202320122015cirDNA片段化水平与2016年与总生存率下降呈阳性关系,2016年似乎是一个强有力的独立预后因素55201720182018评估 TF结合位点的可及性cirDNA片段化模式,能够检测早期结直肠癌57.20192019碎片特征可用于识别组织来源cancers.in一个大的队列562020cirDNA末端基序的多样性显著增加,在癌症患者血浆中观察到4-mer末端基序的优先模式25利用cirDNA片段长度的差异来提高检测突变cirDNA58与肿瘤DNA组分相关的源自肝细胞癌的cirDNA的优选末端坐标特征63SSP sWGS能够区分癌症与健康血浆。比较DSP和SSP sWGS分析揭示了癌症和健康之间的差异3050-532016核小体占有率与核结构相关。短的cirDNA片段具有转录因子的足迹。核小体足迹可用于推断有助于癌症中cirDNA的细胞类型16cirDNA片段的大小分布特征可用于区分健康受试者和癌症受试者,因为通过qPCR观察到总cirDNA量中较短的片段长度,特别是癌症血浆中的突变片段12大规模平行测序在单碱基分辨率下揭示了肿瘤相关CNA优先在短cirDNA片段中14转录因子片段大小特征全基因组核小体占有率片段末端图1.揭示癌症患者和健康受试者之间cirDNA大小分布的定量差异的里程碑研究CNA,拷贝数改变; qPCR,定量聚合酶链反应; sWGS,浅层全基因组测序; SSP,单链DNA文库制备; DSP,双链DNA文库制备; TF,转录因子。单分子光谱学、45或粘弹性提升力毛细管技术。46这种选择的多样性可能为比较cirDNA血浆提取物或来源提供进一步的优势。作为与cirDNA根 据 组 织 来 源 和 生 理 或 病 理 条 件 ( 包 括 凋 亡 、 坏 死 或NETosis),只有少数结构足够稳定,可以在血液中检测到这些结构是:单核小体,血流中最小和最稳定的结构;紧密包装的长双链DNA(dsDNA);以及在较小程度上的双核小体。与之相关的小型结构卷须DNA包括以下步骤:短尺寸(70 bp)的转录因子结合dsDNA;长尺寸和短尺寸的DNA相关微粒;凋亡颗粒;短尺寸的脂蛋白-核酸复合物;以及细胞或细胞部分缔合。关于cirDNA的释放机制,有两种相反的理论被提出。一种观点认为单核小体的突出表明细胞凋亡是主要的释放机制。38,47另一种理论提出,短尺寸的核小体结构是由较长的cirDNA的进行性核酸酶降解引起的,其来源于含有微粒的DNA、坏死、吞噬作用或由淋巴细胞或嗜中性粒细胞(NET)引起的活性释放。48,49迄今为止关于cirDNA片段大小分析的数据表明,一个动态过程依赖于染色质去凝聚和核小体间DNA片段化的快速速率,由核酸酶活性引起的核小体内片段化的速率较慢。虽然这一完整过程在健康个体中表现出高度同质性,但在癌症14、30、50和孕妇15、19、27中有所不同,如下文所述。尽管基于全基因组测序(WGS)的大小测定提供了一系列拓扑信息,但这种分析方法只能检测以下cirDNA片段长度:~1,000 bp。使用qPCR或毛细管电泳,研究报告了健康个体中1,000 - 8,000 bp范围内的片段的显著部分(10%通过组合基于双链DNA文库纯化的测序(DSP-S)、基于单链DNA文库纯化的测序(SSP-S)和N-qPCR分析,在单核体、双核体和较高分子大小(> 1,000 bp)的染色质中缔合的cirDNA估计为67.5%8.5%组学观察虽然各种分析非组学方法已经揭示了对应于单核小体的片段大小47,54;随后,测序允许深入观察,这大大增强了片段组学。癌症筛查依赖于精确的表征、高再现性和控制参数的严格标准化。WGS提高了片段组学的分析能力和分辨率图1中所示的几个里程碑报告12、14、16、25、55-17、60-64Cell Genomics3,100242,2023年1月11日3会开放获取审查~图2.健康个体cirDNA片段大小谱的一致性对17个健康个体的cirDNA血浆提取物进行来自DSP的sWGS绘制每个读数的频率,并以每个血浆的百分比表示在四个不同的时间(n = 7、4、3和3),用两个不同的平台和不同的生物信息学系统(n = 3),从四组不同的血浆DNA(n = 7、4、3和3)生成17个大小谱,并表示为各种叠加颜色的曲线。总的来说,这导致与染色体/单核体相关的主要群体(141和181 bp之间的大峰)和与双核体相关的次要群体(301和381 bp之间的小峰)。在661 bp和约1,000 bp的限值(WGS读数限值)之间,未检测到高于背景的读数。在40和177 bp之间可检测到的周期性约为10 bp的亚峰是在染色体/单体结构表面的DNA分子小沟处暴露于核酸酶活性的结果箭头指示可能出现切口的小沟的位置,并且还提供了与cirDNA相关的核小体结构的示意图,从中可以推断cirDNA片段长度。还突出显示了最常与cirDNA相关的结构:具有166 bp DNA片段的染色体(约3%)和含有147-160 bp片段的无H1核小体核心颗粒17该数字改编自最近一份报告的数据。17从NIPDB 数 据 库 ( 分 别 为 4 个 QLC 和 50 个 NW ) 获 得 了 3.5 埃 分 辨 率 的 染 色 体 和 核 小 体 的 晶 体 结 构 图 像 NIPDB , 核 酸 - 蛋 白 质 相 互 作 用 数 据 库 ,https://npidb.belozersky.msu.ru。cirDNA片段大小谱特征核cirDNA片段化依赖于染色质组织化。1,65cirDNA大小通常对应于大部分单核小体的片段大小,低分数的双核小体,具有痕量的三核小体。cirDNA展示了1、15染色体理论上浓缩166 bp长度DNA的染色体包含组蛋白八聚体((H2 A-H2 B)2(H3-H4)2)和组蛋白单体接头H1(图2)。由于只有2%-17~10 bp周期性足迹可检测到低至31 bp核小体的结构因此,核小体(见图2)。这表明核小体衍生的降解,可能归因于切割,发生在核苷酸中,这些核苷酸在DNA缠绕核心的每个螺旋转角处保持可接近,并且距离组蛋白核心表面最远。1、15、16Yu等人15首次揭示了母体来源的cirDNA的大小谱在143 bp以下表现出约10bp的周期性。总的来说,血液中大多数可检测的cirDNA表现出由DNA与核小体结构之间的缔合引起的足迹1,15,16,18,24,30,50虽然一小部分cirDNA片段与双核小体相关,但它们通过300-360bp范围内的~10 bp周期性足迹来鉴定显示最高频率的检测到的cirDNA片段来自修剪的单核小体,也称为缺乏组蛋白单体接头H1且仅浓缩147bpDNA(单核体)的核心颗粒结构也以高比例的cirDNA结构形式存在(图2)。sWGS(浅或低通WGS)鉴定cirDNA片段,其中在同一区域内的两条链中存在单个切口,导致低至30-40 bp的较小cirDNA大小片段的核小体足迹大多数比未降解的核小体(167 bp)短的cirDNA分子来源于核小体末端的双链切口,或核小体表面的14个点之一,其中DNA暴露在小沟DNA结构上(图2)。<双链断裂也可能发生在核小体表面的两个不同位置(图2).短于41 bp的cirDNA片段的观察很少,这是由于技术上的限制4Cell Genomics3,100242,2023会开放获取审查~~~灵敏度DNA分子的大小越小,它与核小体的结合力就越弱,短片段的这可能是由于DNA从核小体边缘剥离,然后迅速降解。根据DSP-S与SSP-S传统的DSP-S方法检测DNA分子中相比之下,SSP-S尺寸分析揭示了两条链上的切口。由于SSP意味着在测序之前DNA变性和链分离,因此它可能导致单链cirDNA片段长度的不切实际的定量。因此,通过DSP-S和SSP-S尺寸测量收集的数据为cirDNA分子在蛋白质-核复合物上的位置以及保护DNA分子免受血液内降解的方法提供了线索。与DSP-S相比,SSP-S显示了更高比例的较短的cirDNA片段(30-这是因为当DNA分子的两条链中只有一条上有一个切口时,它仍然包裹在核小体周围,因此不会剥离。17,30通过SSP-S对cirDNA大小的详细分析也显示在31-166 nt大小范围内可检测到31 nt的~ 在这种情况下,暴露在核小体表面的两条链移位了3bp,交错为30。因此,通过DSP-S和SSP-S检测到的分子的大小揭示了3bp的移位;该观察结果证实了DSP-S和SSP-S检测到的分子的大小均为3bp。10 bp的周期性和cirDNA包裹在核小体十五,十六SSP-S 能够 检测 由血 液中动 态发 生的 切口产 生的 较短 的cirDNA片段,所述切口在单核小体中包装的一条或两条DNA链中。虽然从DSP-S获得的总体尺寸分布值与通过N-qPCR获得的数据略有不同,但是通过SSP-S和N-qPCR两者确定的那些尺寸分布值是一致的,因为在两种方法中变性步骤采用单链DNA作为初始模板30然而,考虑到同样的峰值,在SSP-S和DSP-S中均观察到~健康同质性个人卷须DNA大小来自健康血浆的cirDNA大小谱的再现性从叠加的谱曲线(图2)中显而易见。17在主峰和所有次峰中,最大频率和大小的变化分别不超过2%-17因此,我们假设:(1)在健康的皮下组织中,细胞释放后DNA降解动力学是一致的;(2)这导致血液中一致的特异性染色质结构,主要是单核体/染色体,以及低比例的双核体;(3)这些结构上的切口/断裂依赖于dsDNA分子位置/包装,以及核酸酶可及性;(4)这种同质性可能是由于cirDNA细胞起源的同质性,特别是对于免疫细胞,如在健康个体中17;以及(5)核小体结构上的锯齿状cirDNA占优势,50其在单核体结构上的比例取决于其长度。长度影响DNA和核小体之间的静电相互作用转录因子结合模式Shendure16、62全基因组图谱体内核小体占有率显示存在与邻近转录因子结合位点的切割相关的较短(35-80 bp)片段,并含有与特异性转录因子相关的DNA基序16癌症患者与健康人的cirDNA片段组学首先用透射电子显微镜对健康人和癌症患者的cirDNA片段长度进行了比较。36由于DNA血浆提取物中白细胞衍生的细胞内DNA的污染(超过50%的片段超过1,000 bp),不可能对癌症患者和健康受试者之间的cirDNA差异进行定量评估。36其他研究也是如此。四、七、八、三十八、六十七、六十八同样,cirDNA突变检测已作为流式细胞术辅助qPCR方法的伴随检测进行在这项测试中,来自癌症样本的小片段被富集,但数量仅为总cirDNA分子的0.01%至1.7%。6虽然这些研究不能提供定量评估或确定的尺寸范围差异,他们首次提出(尽管没有充分证明)癌症衍生的片段通常比对照衍生的片段短。应用qPCR对相对于单核小体中所含的DNA较短(100-在对两种不同癌症类型的研究中,Ellinger及其同事报告说,与健康受试者相比,69和70的cirDNA完整性都较低。根据这些发现,人们得出了不同的结论,癌症患者的cirDNA完整性被描述为较低,11,13,69,71当量,72,73或更高70,74,75。这些差异主要是由于报告的分析前混淆(血浆分离、体积采样、冷冻等)。和分析因素(qPCR靶向序列、检测方法、标准曲线等)七十四七十六在早期发现的基础上,我们假设12采用N-qPCR检测,从60 bp以上扩增9个序列大小,癌症患者来源的cirDNA中60-13,17很少有癌症来源的cirDNA片段超过400 bp(1%),而健康受试者的cirDNA片段更大24%。11,13,17此外,含有特定突变致癌基因序列的片段比含有相同对应野生型序列的片段更易破碎(特别是低于138 bp)28早期的研究对癌症患者cirDNA的大小分布不一致。通过标准化预分析解决了这一问题。67,76-Cell Genomics3,100242,2023年1月11日5会开放获取审查图3. 与健康个体(蓝色)相比,癌症患者的cirDNA大小特征倾向于更短的片段(黑色)该图显示了具有68.5%突变等位基因频率(MAF)的转移性结直肠癌(mCRC)患者的片段组(黑线)与17个健康个体的平均值的片段组(蓝线)的图示比较,垂直线表示片段长度,其中来自健康个体的cirDNA的平均尺寸分布曲线插图:放大对应于与双核体相关的DNA片段的240-480 bp大小范围。与健康平均值相比,癌症患者大小谱在40-151和218-320 bp范围内具有增加的片段数目此外,癌症患者的cirDNA大小谱具体显示:(1)片段水平在145和156 bp之间稳定;(2)在166 bp处较低的片段水平长度;和(3)在双核小体处的较短的相应峰(300 vs.330 bp)。该数字改编自以前报告的数据17显示比相应的野生型序列短。12,13,28因此,可以通过片段水平分辨率的测序准确观察到大小谱的差异(图3)。比较片段大小为Ibp的sWGS读数的频率、来自患有癌症的受试者的血浆的cirDNA大小谱的分辨率与来自患有癌症的受试者的血浆的cirDNA大小谱的分辨率。Thierry和Sanchez29定义了一系列参数,以区分癌症与健康个体cirDNA提取物。总体而言,癌症患者cirDNA相对于健康受试者显示出微妙但可靠的差异(图3)。在患有癌症的个体中,cirDNA差异包括低于150 bp的片段的较高数目,以及151和218 bp之间的片段的较低数目;双核小体对应的片段峰值在约300 bp处,而在约300 bp处,~330 bp。此外,N-qPCR与sWGS identi.与健康人相比,癌症患者中>1,000 bp的片段比例较低。17sWGS可准确测定约1,000 bp以下的cirDNA片段的大小,而分子量更高的cirDNA具有诊断效用。例如,由于NET,血液中高分子量DNA或染色质的动态降解可能与癌症有关。48然而,由于上文讨论的因素,这种长片段的定量目前受到偏差的影响。需要对长cirDNA片段进行进一步研究,以更全面地解读其诊断价值。使我们能够基于cirDNA大小谱高度区分癌症患者和健康个体的更精确的参数已被确定为单个片段长度的频率、单碱基分辨率的独特读数的频率、1 bp分辨率的两个单个片段长度的频率差异、大小范围分数频率或大小范围比的差异17,29(图2)。突变或恶性细胞来源的cirDNA含量的组成越高(量化为突变等位基因频率[MAF]),转移性结直肠癌患者和健康个体的血浆cirDNA大小谱之间的差异就越大17,29和肝细胞癌患者和健康个体。然而,尚未观察到这种相关性成正比。正在开发的用于筛查癌症的高级组学方法沿基因组的染色质组织不是随机的,并且可能对细胞基因调节和细胞类型具有特异性81,82(图2)。因此,片段长度不是唯一的参数,需要进行研究的目的,区分不同来源的cirDNA片段。来自cirDNA片段组的其他分析信号包括非随机片段化模式、转录因子占有率、DNA GC含量和末端基序模式。核小体占有率cirDNA的深度测序允许鉴定核小体占用的全基因组图谱,证实了染色质/核小体占用相关模式,其中短cirDNA片段揭示了转录因子占用的足迹16(图1)。该方法可以推断哪些细胞类型在病理状态下,特别是癌症中对cirDNA有贡献(表1)。几乎所有的短cirDNA片段都与核小体相关,突变等位基因通常以较短的片段出现62片段长度62的特定子集的生物信息学分离有助于检测突变cirDNA。已利用该方法58、83(图1)提高体外和计算机模拟方法检测cirDNA存在的灵敏度,以富集90至150 bp片段大小的cirDNA在一个大型队列中,这种大小选择改善了神经胶质瘤、肾癌和胰腺癌患者五十八、八十三核小体耗竭区根据微球菌核酸酶消化的初步观察,其中鉴定了启动子处的核小体模式,90Ulz et al.57,91表明,核小体缺失区(NDR)的分析提供了有关细胞将其DNA释放到血液中的功能信息特别是,来自健康供体的片段组模式反映了造血细胞的表达特征对癌症患者血浆的机器学习分析揭示了与体细胞癌相关的癌症驱动基因。表1.基于片段组学的癌症早期检测临床分析方法分析方法测试群体特征总结参考大规模DELFI:全基因组5 Mb多早期需要深度测序;Cristiano等人56染色质无细胞DNA决议癌症大型回顾性队列(n = 236);Mathios等人84组织碎片化区分各种癌症类型;后续报告局部基因组定向感知1 kb早期从EGA中检索的小规模队列(n = 90);Sun等人85箱cirDNA片段化决议肝细胞与妊娠组织相比,分析(OCF)癌妇女和器官移植接受者DNA片段化1 kb早期从公共数据集Zhou等人86热点决议肝细胞(n = 60);癌告知组织来源的某些元素;开放染色质区域TFBS:评估进行测序早期大型回顾性队列(n = 213);Ulz等人57TF结合位点1 kb分辨率结直肠癌更先进的方法跟随片段无障碍转录起始位点片段级别优选的末端进行测序早期需要深度测序;Jiang等人59片段级别肝细胞小规模队列(n = 90);(1,000 bp)癌告知组织来源,与决议糖尿病患者;未报告末端基序和进行测序早期需要深度测序;Jiang等人25多样性评分片段级别肝细胞小样本组(n = 34);(1,000 bp)癌全局和局部分析;决议未报告锯齿状端片段水平早期肝细胞小样本组(n = 34);继2008年观察到Suzuki等人87Jiang et al.59(1,000 bp)癌血浆中双链DNA的形式决议甘草测序尤文肉瘤小规模队列(95例EwingPeneder等人88算法:表观遗传在多个和儿科肉瘤和31例其他儿科签名基于决议肉瘤肉瘤);cirDNA片段化未报告患者分期;模式未报告灵敏度或特异性;机器学习分类器MITEST算法:N-qPCR多个早期和大样本队列(N = 983);Tanos等人89核和线粒体晚期癌症机器学习分类器来源和签名基于cirDNA块度分布该表说明了迄今为止使用的大多数各种技术与观测数据。然而,它并没有试图比较它们各自的功效,因为在大多数研究中,机器学习算法并没有被指出,并且一些研究已经仔细选择了可能有偏见的样本例如,AUC(曲线下面积)值无法进行比较,因此无法评估性能值。OCF,定向感知血浆无细胞片段化信号; TF,转录因子; TFBS,转录因子结合位点; AUROC,受试者工作特征曲线下面积; MDS,末端基序多样性评分; N-qPCR,巢式qPCR;欧洲基因组档案,EGA。会开放获取6Cell Genomics3,100242,2023审查会开放获取审查Cell Genomics3,100242,2023年1月11日7图4. cirDNA片段化和片段组学变量能够在癌症筛查试验qPCR,定量聚合酶链反应; sWGS,浅全基因组测序; SSP,单链DNA文库制备; DSP,双链DNA文库制备; AFM,原子力显微镜。定 量 评 估 , 并 与 突 变 体 或 肝 脏 来 源 的cirDNA的量相关(图1)25。这显示了作为改进的治疗诊断或潜在癌症筛查的成本有效方法的前景。在提供末端基序可以表征癌症来源的cirDNA的概念证明时,Lo的小组证实了分析cirDNA片段末端的重要性。此外,CCCA基序在HCC患者中的丰度较低,25,63并且cirDNA末端基序的分布可能取决于组织来源。 基于这些观察,已经提出cirDNA可以用于鉴定其他临床领域中的生物标志物,例如移植监测25,85和NIPT。63拷贝数增加。因此,在转录起始位点和外显子连接处的NDR分析可以提供一种定量且具有成本效益的方法来跟踪肿瘤cirDNA动力学和进展。DELFi全基因组cirDNA片段化虽然2016年报道了第一个使用cirDNA的机器学习辅助癌症筛查测试,但91DELFI(早期拦截片段的DNA评估)是第一个采用片段组学的测试(图1)。DELFI从短(100-150 bp)与长(151-220 bp)片段的比率中利用关于沿着基因组的5 Mb窗口中的片段长度的信息12,13,29该测试以及基于突变的cirDNA分析,56个临床风险因素和致癌物胚胎抗原水平,使cirDNA在91%的受试者和94%的受试者中检测到所有阶段和亚型的癌症,包括91%的I/II期和96%的III/IV期,特异性为80%。84该研究证实,片段组学分析利用转录因子结合位点来区分患有小细胞肺癌的个体和患有非小细胞肺癌的个体(AUC = 0.98)。84cirDNA片段末端来自肝细胞癌(HCC)的cirDNA片段末端通常映射到特定的基因组坐标,其可以是结合DSP-S和SSP-S的sWGS分析SSP-S先前已用于古生物学领域以生成高分辨率基因组的古老和普遍高度降解(短)的DNA。93它揭示了相对于DSP测序更高比例的短片段(168 nt)。17,29,93,94注:与DSP-S相比,SSP-S分析更好地协调了测序和N-qPCR分析确定的片段大小分布。 30SSP-S显示,与来自健康个体的cirDNA相比,癌症患者中约40-由于基于SSP-S的大小谱提供了短大小片段数目的富集,因此SSP-S可能更适合于癌症筛查。17,29, 30此外,SSP-S还可检测不同DNA链断裂导致的片段大小。Sanchez et al.17推断,包装在染色体上的DNA分子是双链的,并且由于核酸酶活性而表现出各种结构这些结构各不相同:完整/钝的dsDNA、在一条链中具有一个或多个切口的dsDNA和在两条链中具有一个或多个切口的dsDNA,后一种DNA末端大多是锯齿状的,这意味着它们具有单链突出末端17(图4)。此外,SSP-S提供了比DSP-S更多的序列信息,因为它保留了每个输入DNA片段的精确的50和30突出端点,提高了基于cirDNA片段末端基序的方法的性能。25会开放获取审查8Cell Genomics3,100242,2023~结合qPCR和sWGS片段组学来自DSP和SSP的sWGS与N-qPCR的组合包含完整的cirDNA片段大小分布。这种组合方法准确地揭示了癌症和健康cirDNA之间的差异。例如,当比较特定单个大小和1 nt分辨率下,或选定大小范围下,或低于1,000 bp和超过1,000 bp的选定大小分数范围比率下的cirDNA频率时,识别差异50通过常规测序的片段检测的大小下限和上限~1,000 bp。相比之下,结合N-qPCR和浅WGS的分析显示,在健康个体中10%-肿瘤特异性转录因子结合图谱cirDNA转录因子谱分析位点以及表达和沉默管家基因的核小体发生水平可以告知癌症中拷贝数的改变。受这种基因组修饰影响的基因的表达通常在癌症情况下的特定基因中不同。将机器学习辅助基因分类应用于数据,在健康个体的血浆中鉴定了造血表达特征。相比之下,转移性癌症患者的血浆表达的癌症驱动基因表现出体细胞拷贝数增加。通过对来自健康个体和癌症患者的一千多个cirDNA样本中的肿瘤特异性转录因子结合位点(TFBS)进行从血液样本中绘制肿瘤特异性转录因子结合的能力有助于非编码基因组的临床分析。利用来自cirDNA片段化模式的数据和TFBS的可及性,Ulz等人以高准确度区分了患者特异性和肿瘤特异性模式,从而可以检测早期癌症。57cirDNA锯齿末端分析检测锯齿状末端59的能力还使得能够检测癌症86(图4)。对双链血浆cirDNA的分析表明,在50和30端的C和G cirDNA片段的比例不均匀,并且还揭示了血浆中5087通过直接比较DSP-S和SSP-S衍生的尺寸分布推断锯齿状末端的存在17 、30、50与对照个体相比,在HCC cirDNA片段中观察到更高百分比的锯齿状末端59后来报道了基于使用甲基化胞嘧啶进行末端修复反应的CC标签技术的进一步发展,因为人类基因组中通常存在未甲基化的非CpG胞嘧啶。这种技术进步有助于从膀胱癌患者血浆中鉴定尿cfDNA,已经通过使用亚硫酸氢盐配对末端测序(称为Jag-seq)分析锯齿状末端来鉴定。86应用于片段组学的计算分析和机器cirDNA片段组学通常从低深度测序(称为低通或浅测序,2-103)产生cirDNA计数这与高深度(~50,0003)形成小区域(2 Mb)的测序,用于在“液体活检”方法中检测突变。计算分析基于测序常规工作流程,包括(1)质量控制和读数预处理;(2)比对和可视化;以及(3)统计分析和解释。基于参考或无参考的去卷积算法能够从信号混合物中恢复原始信号,并且似乎有助于减轻肿瘤异质性问题。在搜索疾病相关模式时应用的WGS分析需要无偏的方法。机器学习使得能够在具有许多可测量变量的测定中识别/分类可能与一般筛选群体相关的特征。因此,可以通过辅助学习cirDNA谱和癌症状态之间的关联的96为应用预测模型开发了各种机器学习方法,如人工神经网络、贝叶斯网络、支持向量机和决策在癌症筛查的情况下,在依赖于cirDNA分析的基于分析的方法中,决策树方法似乎是最常用的。五十六、六十一、八十九其他最先进的高吞吐量方法基于片段组学的技术可能被证明可用于筛查癌症患者的血浆(表1)。一个令人兴奋的发展是利用断裂模式来表征开放染色质区域(OCR)。85这项技术提供了一种确定特定cirDNA片段来源组织的手段。生物信息学管道OCRDetector通过将cirDNA测序覆盖率与跨越120 bp基因组窗口的DNA片段数量相结合,减去同一窗口内具有终点的片段数量,从而实现OCR的检测97在正常和癌症受试者中已经报道了数千种独特的血浆染色体外环状DNA(eccDNA)98这些microDNA首先在细胞核中发现,源自染色体基因组,并显示出比线性cirDNA更长的序列长度(30我们看到了扩展cirDNA片段组学的前景,包括eecDNA的诊断,基因调控的审查,更好地了解细胞间通讯的探索。cirDNA片段化热点可以表征早期癌症患者。特定基因组区域的低片段化已经确定了早期HCC的热点这些发现提示了在早期癌症中检测基因调控畸变的可能性。最后,我们看到了将3D基因组状态纳入cirDNA共片段化模式分析的希望,该模式来自核内两个空间上接近的区域,cfDNA测序61方法。核活动cirDNA片段化是一个动态过程30,并取决于循环系统内的核酸酶活性这会开放获取审查Cell Genomics3,100242,2023年1月11日9影响分析特征,如结构、片段化模式、长度和cirDNA片段末端序列。23、24、61、99DNASE1L3、DNASE1和DNA片段化因子B都在片段化过程中发挥作用。cirDNA片段化过程的模型假定DNA片段化因子B和DNASE1L3以及凋亡核酸酶在细胞内产生DNA片段血浆,并且血浆DNASE1L3负责细胞外核酸酶活性。虽然A端富集的cirDNA主要在细胞内产生,但DNASE1L3在血浆中产生C端富集的cirDNA。99它假设核小体随后伴随着DNA酶1和蛋白水解进一步降解至完全消化的点。已经提出了关于cirDNA片段化的更广泛的观点49:除了释放的凋亡机制之外,循环中的单核小体可能通过染色质的动态降解或来自各种生物过程的高分子量DNA(特别是来自NET)而来自核酸酶。尽管事实上,在诱导的细胞凋亡之后,单N和二N相关片段具有与血液中发现的cirDNA相同的模式,但仅这种相似性不足以成为将所有cirDNA视为细胞凋亡产物的理由。两个NETs标记物,髓过氧化物酶和中性粒细胞弹性蛋白酶,对HMW DNA具有催化能力,表明NETs具有自分解代谢特性。[100]所提出的原代cirDNA细胞来源于巨核细胞和嗜中性细胞。101这是通过无细胞染色质免疫沉淀,然后在健康和患有癌症的个体中进行测序(cfChIP-seq)来鉴定的。该实验表明,低测序深度(sWGS)可以从血液样本中获得系统和全基因组信息,为诊断和询问产生cirDNA的生理和病理过程提供了一系列机会。101NET是以一种不成问题和不显眼的方式组成性形成的,但它们的形成在癌症进展期间可能会增加,48,102在癌症进展期间它们表现为炎症性疾病。N-qPCR或毛细管电泳可检测超过1,000bp的HMW cirDNA,尤其是2,000 - 10,000 bp,50可能来源于坏死和NETosis(图4)。然而,与源自健康个体的cirDNA相比,源自癌症的cirDNA具有低频率的HMW cirDNA。三十,五十低于140 bp,特别是低于70 bp、14 、 30 、 50 、 56 、 60 的片段表明cirDNA片段化过程的差异,可能是由于核酸酶活性的差异。迄今为止,对这种现象的描述很少尽管如此,我们推测这种片段化过程可能是由于恶性细胞DNA中发现的特定遗传和表观遗传特征或者,这可以通过肿瘤微环境来解释,因为肿瘤由特定环境(特征在于ROS、缺氧、矿物质、pH、营养物等)内的恶性细胞、基质细胞、内皮细胞和免疫细胞组成尽管需要进行大量片段组学在常规筛选试验中的局限性对于临床应用,cirDNA片段组学是新兴的cirDNA标记领域中的一种新兴方法。与任何新兴的生物标志物一样,仍然存在许多障碍。技术/分析预分析如上所述,来源于肿瘤与健康组织的cirDNA之间的大小分布差异是显著的,但很小。潜在的混杂因素包括由于血浆分离前血液样本处理和储存不当导致cirDNA提取物可能被血细胞基因组DNA污染。76降解后从血细胞基因组释放的高分子量DNA受到核酸酶活性的影响,并导致检测到DNA片段,其大小对应于它们在三或四核小体(分别为440-500和600-700 bp范围)中的包装,这在对几乎纯的血浆DNA提取物进行sWGS分析后没有观察到。50,56为了估计该混杂因素,小于260 bp的片段的比例不应低于总cirDNA的70%。76质量控制也可以用Agilent毛细管电泳或使用sWGS进行。计算虽然生物信息学大大提高了测序/WGS方法的分析能力,但不幸的是,但也存在潜在的局限性。首先,为评估片段组学而开发的基于NGS的方法需要使用大量的计算资源、高通量NGS平台、复杂的生物信息学分析和高速数据处理;这些要求可以显著增加产生分析数据所需的成本和时间。从cirDNA提供/实施多模式分析目前是具有挑战性的,因为其依赖于标准高通量测序,这需要特定的方案来研究不同类别的生物标志物。多种因素使得片段组特征的鉴定特别具有挑战性,包括作图和测序偏倚、读取深度不足、GC含量、PCR扩增、参考基因组的选择和k-mer组成;这些因素都可能导致计算模型产生误导性结果。64,97然而,已经描述了校正和标准化覆盖率和尺寸衍生的技术伪影的方法。103,104此外,在检测特定片段组特征,如锯齿状末端或OCR时可能出现计算问题。由于典型的测序方案利用几个DNA修复步骤来最大化可分析DNA的量,因此关于DNA末端状态的信息可能丢失。受控访问存储库目前还没有公开的中央数据库,统一处理的cirDNA数据集。此外,最近有人试图提出会开放获取审查10Cell Genomics3,100242,2023一个全面的数据库,用于托管不同病理条件下的cirDNA WGS数据集105生理极限由于片段组学领域仍处于起步阶段,缺乏已知的生物混杂因素限制了大多数技术方法的实施。使用cirDNA作为泛癌症筛查工具的一个生物学限制是检测灵敏度水平,50,106-108与所使用的遗传学、表观遗传学或片段组学方法无关。在任何疾病迹象之前早期发现癌症是一个主要目标。因此,cirDNA依赖于其追踪来自小肿瘤的肿瘤cirDNA的能力许多研究报道了在早期癌症中,特别是在小体积的肿瘤中,检测来自恶性细胞的6,8,109这首先是由于cirDNA的量受到肿瘤大小的限制;其次,由于cirDNA MAF通常较低,因此难以区分相对于野生型cirDNA的优势,携带遗传或表观遗传改变的cirDNA。直径大于10-15 mm的肿瘤可能通过分析突变cirDNA(cir-mutDNA)可预测地检测到。然而,MAF低于0.1%110的cirDNA低于大多数组学技术的灵敏度水平。基于sWGS的片段组学的实际应用目前仅限于早期癌症筛查。例如,大多数基于cirDNA的方法在检测I期或II期癌症方面的灵敏度较低(30%)。56,110,111这是唯一正确的,无论如何,当仅仅依赖cir-mutDNA。我们的研究小组推测,cirDNA片段的大小也可能取决于来自肿瘤微环境的cirDNA,这可能会产生具有癌症特异性cirDNA片段化特征的细胞。由于肿瘤细胞的存在而导致的生物学因素可能影响一部分野生型cirDNA的片段化。89例如:(1)肿瘤微环境细胞(如内皮细胞、基质细胞或免疫细胞)的核酸酶活性与正常细胞相比可能会发生改变;(2)cirDNA来源于肿瘤表面或肿瘤内部
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功