没有合适的资源?快使用搜索试试~ 我知道了~
技术PCR扩增子鉴定人类着丝粒阵列中广泛的拷贝数变异和癌症中的不稳定性图形摘要亮点新的数字液滴PCR检测方法测量人类着丝粒d拷贝数和个体特异性指纹存在d着丝粒阵列拷贝数在培养的人细胞中稳定对原发性人类癌症样本的分析表明,癌症作者莱昂纳多·戈麦斯·德利马,Edmund Howe,Vijay PratapSingh,...凯伦·H萨拉?米加作者:Jennifer L. Gerton对应jeg@stowers.org简言之de Lima等开发了一种基于着丝粒阵列中拷贝数的测量来估计人着丝粒大小的PCR方法。作者使用这种方法分析了不同人群的正常组织他们还证明了癌症样本中着丝粒拷贝数的变化,这表明了一种新的基因组不稳定性。de Lima等人,2021,细胞基因组学1,1000642021年12月8日-作者。https://doi.org/10.1016/j.xgen.2021.100064会会~开放获取技术PCR扩增子鉴定人类中广泛的拷贝数变异着丝粒排列与癌症莱昂纳多·戈麦斯·德利马,1,6埃德蒙·豪,1维贾伊·普拉塔普·辛格,1塔玛拉·波塔波娃,1李华,1徐宝山,2杰玛·城堡,3史蒂夫·克罗齐尔,3克里斯汀·J。哈里森,3史蒂夫C。克利福德,3凯伦H。Miga,4SarraL.Ryan,3岁和Jennifer L. Gerton1,5,*1Stowers Institute for Medical Research,Kansas City,MO,USA2中山大学光华口腔医学院口腔医学研究所广东省口腔医学重点实验室口腔医院广东省广州市3纽卡斯尔大学癌症中心,英国泰恩河畔纽卡斯尔4加州大学圣克鲁斯分校基因组学研究所,加州大学圣克鲁斯分校,美国5堪萨斯大学医学中心,堪萨斯州堪萨斯城,美国6引线触点* 通讯地址:https://doi.org/10.1016/j.xgen.2021.100064jeg@stowers.org总结着丝粒α-卫星重复序列占人类基因组的6%,但它们的长度和重复性质使这些区域的测序和分析具有挑战性。然而,着丝粒是染色体稳定繁殖所必需的,因此迫切需要工具来监测着丝粒拷贝数以及它如何影响染色体传递和基因组稳定性。我们开发了液滴数字PCR(ddPCR)测定法,并对该测定法进行了基准测试,该测定法测量了5种人类着丝粒阵列的拷贝数我们应用它们来表征着丝粒阵列大小的自然变异,分析了来自中国的37个个体和来自美国和英国的39个个体每个染色体特异性阵列的大小在个体之间变化高达我们还使用ddPCR测定来分析四种癌症类型的76个匹配的肿瘤正常样本中的着丝粒拷贝数,这代表了迄今为止癌症中着丝粒阵列稳定性的最全面的定量与培养细胞中的稳定传递相反,着丝粒阵列显示每种癌症类型中的获得和丢失事件,表明着丝粒α-卫星DNA代表癌症中基因组不稳定性的新类别。我们测量人类着丝粒阵列拷贝数的方法将推进正常和疾病状态下着丝粒和基因组完整性的研究介绍着丝粒代表了人类基因组中最难表征的一些区域,并且直到最近,在人类参考基因组中缺乏着丝粒序列一直是对基因组完整性和不稳定性的研究的限制人类着丝粒是一个巨大的重复区域,对染色体传递至关重要。为了了解基因组的完整性和基因组不稳定的病理状态,如癌症,更好地表征人类着丝粒序列是必不可少的。着丝粒是染色体的位置,其中动粒蛋白组装用于微管附着和染色体分离。每个人的着丝粒都是一个大的单倍型的一部分,1这有可能使染色体传递保真度发生偏差。长读段测序技术的最新进展已经使得性染色体和8号染色体的着丝粒的组装能够实现,单一参考基因组。25-着丝粒阵列的串联重复结构使其可能易于拷贝数变异。阵列大小的增加或减少反过来又会影响染色体的传递。先前的工作表明染色体传递的偏差可能与着丝粒DNA有关。例如,着丝粒组蛋白变体着丝粒蛋白A(CENP-A)和动粒蛋白结合可以随α-卫星含量而缩放,8并且具有大动粒的染色体具有增加的表面以用于与微管的潜在相互作用。9此外,非随机的染色体错误分离已被追踪到着丝粒。图10、11"CellGenomics 1,100064,December 8,2021 <$2021作者。1这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。会开放获取技术2Cell Genomics1,100064,2021假设认为较大的着丝粒阵列募集更多的动粒蛋白,因此,在细胞分裂过程中可能偏向分离;因此,大小可能影响哺乳动物减数分裂和有丝分裂过程中的染色体传递。12,13然而,这是一把双刃剑,因为与较大动粒相连的较大着丝粒阵列倾向于建立错误的端部附着并在后期错误分离。9因此,着丝粒阵列大小可能影响着丝粒蛋白或染色体分离机制的其他组分的募集,这可能导致分离偏倚。此外,着丝粒阵列的大小可以影响基因组的完整性,通过滴定异染色质蛋白质。因此,鉴于着丝粒阵列对基因组完整性的潜在影响,研究着丝粒阵列的稳定性和防止不稳定性的机制癌症通常与影响基因组完整性的改变有关。许多类型的基因组不稳定性事件与癌症相关,从称为染色体不稳定性(CIN)的全染色体获得和丢失事件到结构变异,如易位、基因扩增和微卫星不稳定性(MIN)。拷贝数变异在人类基因组中是猖獗的14,并且可以通过染色体重复扩增和收缩或通过染色体外DNA发生。拷贝数的变化可以显著改变细胞的表型。15体细胞拷贝数变异提供了选择的机会,极大地扩展了可以取样的遗传景观,以在特定环境中实现“适合”增殖性癌症状态。癌症中着丝粒重复序列的稳定性尚不清楚,但考虑到对基因组完整性的潜在影响,这是一个重要问题。广告稳定性取决于获得允许设计引物对的序列,所述引物对将准确定量着丝粒重复的拷贝数。在这里,我们报告的发展和应用数字PCR为基础的测定着丝粒重复拷贝数。该方法的开发包括序列信息和针对最近由T2 T(端粒-端粒)联合会产生的着丝粒区域的线性组装的基准。在这项研究中,我们开发了五种着丝粒分析方法,并对X染色体上的三个串联基因重复阵列和一个大卫星阵列进行了额外的分析。3在未来,可以基于着丝粒组装开发这些测定代表了对现有方法的显著改进,并证明了拷贝数的准确和可重复测量,仅需要约1 ngDNA。我们应用这些液滴数字PCR(ddPCR)检测来评估人类群体中着丝粒阵列大小的自然变异,分析了来自中国的37名个体和来自英国和美国的39名个体的正常组织。我们确定了广泛的拷贝数变异,在个别人centro- meric阵列以及阵列组合。我们还在四种类型的癌症中应用了这些测定,代表了迄今为止癌症中着丝粒阵列稳定性的最全面的定量分析。我们确定在这些癌症类型的每一个着丝粒阵列的不稳定性,基因组不稳定性事件,我们称之为一个-卫星不稳定性。未来的目标包括开发检测着丝粒单倍型和跟踪单倍型功能的工具。是的。为了理解癌症中着丝粒阵列不稳定性的重要性,我们必须增加分析的检测组以及分析的癌症的数量和类型,以识别重要的癌症类型和着丝粒特异性特征和模式。此外,α-卫星不稳定性需要放在更广泛的基因组不稳定性特征的背景下。一旦这些模式被完全阐明,研究人员就可以确定它们作为预测治疗反应的生物标志物的有用性。只有当该领域对着丝粒阵列的变异、稳定性和功能有了清晰的了解,结果几种方法已被用于分析人类着丝粒大小:(1)序列组装,(2)定量PCR(qPCR),和(3)脉冲场凝胶电泳(PFGE)。然而,这些方法具有显著的缺点。由于DNA序列的重复性质,从短读段测序数据组装着丝粒已被证明是棘手的,使得前癌症基因组数据对于该目的没有用。迄今为止,包括着丝粒区域组装的基因组组装依赖于使用方法组合的高覆盖率测序数据,这是昂贵的,需要密集的计算工作,因此对于大量匹配的肿瘤正常样品是不可行的。qPCR方法依赖于从质粒上克隆的着丝粒序列产生的标准曲线;小于2倍的变化难以检测,尚未进行染色体数目的标准化,并且尚未针对标准基因组对引物对的着丝粒阵列大小估计进行基准测试。16,17PFGE需要大量的完整染色体,分辨率有限。我们的目标是开发一种简单,快速,准确的方法用于着丝粒拷贝数分析,这可以很容易地在实验室之间实施。为了检查人类着丝粒重复序列,我们开发并基准化了基于ddPCR的方法来测量五种不同阵列的拷贝数。数字PCR的工作原理是将限制性消化的模板DNA分成数千个单独的平行PCR反应,然后进行热循环以扩增产物,然后基于染料检测阳性和阴性液滴。阳性和阴性液滴的分数允许对靶分子的数量进行绝对计数在样品中,不需要标准品或内源性对照品。ddPCR是拷贝数测量的理想选择,因为其具有准确性、再现性、导出绝对数量的能力、可扩展性和低模板要求。着丝粒阵列由α-卫星DNA组成,即单体之间仅50%-70%相同的171-bp序列每个阵列由特征数量和序列的单体组成,这些单体几乎相同地迭代(称为高阶重复[HOR])以形成阵列。将单个重复序列中独特扩增子的拷贝数乘以内切酶中HOR的大小,Cell Genomics1,100064,2021年12月8日3会开放获取技术A图1.着丝粒阵列的分析ddPCR(A) 一个示意性的概述提出了通过ddPCR的着丝粒阵列尺寸测量工作流程。在GRCh38中鉴定了分析的每个高阶重复序列(HOR)阵列的独特非重叠扩增子。通过除以染色体特异性单拷贝基因的拷贝数来归一化阵列拷贝数值。通过将拷贝数乘以单个重复的大小来计算阵列大小。(B) 通过ddPCR一式三份地对CHM13对五个不同的着丝粒阵列进行拷贝数测量,证明了高重现性。误差酒吧是计算关于Taylor扩展并基于标准devia-B每个重复实验的浓度。(C) 将源自CHM13 v1.0的计算组装的每个HOR的拷贝数和以Mb计的阵列(D) 10个人的独特指纹图谱(AJ)显示。条形表示归一化的正常乳腺组织中5个着丝粒阵列的平均着丝粒阵列大小(Mb)从10个体D阵染色体可以具有单个阵列或多个阵列,但是只有一个阵列将对于染色体传递是活跃的。我们设计了针对存在于阵列DXZ 1、D18 Z1、D11 Z1、D 7Z 2和D 6 Z1中的独特扩增子的PCR引物(图1A;表S1)。染色体由'' D,''后面的符号指定,数组由后面的数字指定Z为了设计引物,我们使用肌肉算法18对构成HOR的每个单体进行多重序列比对并进行成对比较,以发现每个HOR中的独特区域,并鉴定在hg 38基因组中产生约100 bp扩增子的17-24 bp引物我们接下来使用University of California,Santa Crus(UCSC)浏览器(https://genome.ucsc.edu/cgi-bin/hgPcr)进行计算机模拟PCR,以确认扩增子全部来源于具有靶向HOR的染色体。预测选择用于消化每个扩增子周围的模板的限制性内切酶切割最小值,在给定阵列的每个重复中两次(表S1),确保重复将被分离以分配到液滴中。除图1中的扩增子外,我们还纳入了先前发表的D8Z2检测试剂的信息(表S1和S2)。每个染色体上独特的单拷贝基因的扩增能够使染色体拷贝数标准化,这对于癌症样品尤其重要。与多个生物重复测量相关的误差约为10%(图1B)。基准测试的DNA模板来自于CHM13,最新和最完整的单倍体参考基因组。设计和验证准确反映阵列大小的引物的能力大大增强最近的着丝粒组装(CHM13 v1.0)。然而,我们目前还不能报告万无一失的扩增子设计原则,需要进行大量的试错和基准测试来开发其他检测方法。此外,一些染色体具有高度相似的着丝粒阵列,并且可能无法通过PCR区分(例如,1/5/19、13/21、14/22)。为了进一步对测定进行基准测试,我们进行了两种类型的分析。首先,我们比较了DXZ 1在四种不同细胞系(LT690、HAP1、T6012和CHM13)中从拷贝数计算的大小与通过PFGE估计的大小在所有4例病例中,两次测量结果一致。3LT690中的DXZ1阵列因其相对于平均值的小尺寸(约1,500 kb)而引人注目,平均值接近3,000 kb,如1998年首次基于PFGE报道的那样。20其次,我们将ddPCR计算的大小与所有五个计算估计的大小进行了4Cell Genomics1,100064,2021会开放获取技术A BC在CHM13基因组中组装阵列(D6Z1、D7Z2、D11Z1、D18Z1和DXZ1)。CHM 13来源于一个棘球蚴--所有的染色体都是父系来源的,所以尽管它是二倍体,但它的每条染色体只有一个单倍型。使用基本局部比对搜索工具(BLAST)鉴定CHM13基因组中具有95%同一性的扩增子,以计算CHM13中的预期拷贝数,并与实验获得的拷贝数进行比较。ddPCR的估计值与CHM13v1.0的重复次数和组装阵列大小一致(图1C),尽管ddPCR方法似乎略微低估了拷贝数和阵列大小(见研究限制)。然而,总的来说,拷贝数意味着-图2.两个地理位置(A) 比 较 正 常 组 织 中 D6Z1 、 D7Z2 、 D11Z1 、D18Z1和DXZ1的着丝粒阵列大小(Mb),这些使用Wilcoxon-Mann- Whitney双样本秩和检验,两组中D 6 Z1、D11 Z1和DXZ 1着丝粒阵列的分布存在显著差异(p 0.001)。D18Z1和D7Z2的着丝粒阵列没有显示出显著差异。(B) D7Z2的y轴相对于(A)中的呈现被扩展,使得数据可以更好地可视化,因为D7Z2比其他阵列小得多(C) 每个数组的最小值、中位数、最大值和数组大小范围以Mb为单位显示,并按地理来源区域划分。测定是精确的和可重复的,仅需要~1 ngDNA,并且可以在几个小时内进行,使得ddPCR对现有的测量着丝粒阵列的方法有显著的改进(参见文献S1)。正在努力开发和基准测试更多的着丝粒阵列。中心单体单倍型在PFGE的分辨率下通过种系稳定地传递。5、21、22我们使用两个体细胞二倍体细胞对位分析分化前后的着丝粒阵列拷贝数:(1)人包皮成纤维细胞与诱导多能干细胞,和(2)人滋养层干细胞及其相应的分化的绒毛外滋养层(图S1)。在干细胞和分化的细胞中,五种阵列的测量结果相似,表明着丝粒阵列在体细胞的分化过程中是稳定的(表S2)。重要的是要注意,对于二倍体细胞,测量值代表两个单倍型的平均值。着丝粒阵列长度多态性已在人类中被记录。6,7,22我们使用ddPCR检测来检查人群中着丝粒阵列大小的自然变异。我们分析了来自中国的37名个体和来自英国和美国的39名个体的正常组织中DXZ1、D18Z1、D11Z1、D7Z2和D6Z1的阵列大小。单个阵列显示出高达10倍的大小变化和高达50倍的不同阵列之间的变化(例如,0.1-1、6、23Cell Genomics1,100064,2021年12月8日5会开放获取技术每个个体具有独特的着丝粒阵列或指纹的互补,如通过多个个体中的多阵列测量所表征的(图1D;表S3),表明功能差异的可能性,这是未来研究的重要主题。我们没有检测到在单个基因组内分析的五个不同着丝粒阵列的大小之间的任何相关性。考虑到独特的个体特征,疾病状态中着丝粒稳定性的分析完全依赖于具有匹配的正常DNA样品,这是在先前的研究中没有一致使用的重要参考。17我们获得了四种不同癌症类型的匹配DNA样本:头颈癌、乳腺癌、髓母细胞瘤和急性淋巴细胞白血病(ALL),并比较 了 DXZ1 、 D18Z1 、 D11Z1 、 D7Z2 和 D6Z1 的 拷 贝 数 ( 表S3)。髓母细胞瘤和ALL主要是儿童癌症,样本包括基于细胞遗传学和分子表征的分子亚组(表S4)。除了着丝粒阵列,我们更广泛地研究了串联重复序列的稳定性。髓母细胞瘤和ALL样本中倍性的广泛基因组分析(表S4),包括细胞遗传学分析,如G带和荧光原位杂交(FISH; ALL)和甲基化阵列(髓母细胞瘤)24,使得能够评估和解释每个儿科癌症样本中相对于正常样本的额外串联重复序列的拷贝数变化。X染色体编码人类基因组中约50%的癌-睾丸(CT)抗原编码基因,之所以这样命名是因为它们在睾丸和癌症中表达。这些基因通常以串联重复序列编码(例如,CT45、CT47和GAGE)。已报道家系中低水平的减数分裂重排和实体瘤中的有26DXZ 4是一个具有减数分裂不稳定性的大染色体X连锁串联阵列针对CHM13的X染色体的计算组装对所有四个阵列的27个ddPCR结果进行基准测试,并且结果高度一致3(表S2)。与在培养细胞中观察到的稳定性相反,我们观察到相对于匹配的正常组织,在所有四组癌症样品中阵列拷贝数的显著变化。我们测量了每个匹配的肿瘤和正常样品中的拷贝数,从正常样品中减去肿瘤的拷贝数,并将其绘制为测量的每个阵列的阵列大小变化的百分比(图3)。所有九个阵列显示所有四种癌症类型的扩张和收缩,一旦增益和损失事件按比例缩放到起始阵列的大小,变化是相当的(图3)。基于该方法的10%误差,在76个匹配样品中评估了380个着丝粒阵列和185个串联重复序列的20%误差窗口之外的测量数。超过58%的测量的阵列(328/565)落在癌症样品中的误差窗口之外,表明广泛的串联重复不稳定性。每个个体癌症样品呈现一个或多个显著事件,表明着丝粒α-卫星DNA拷贝数的变化在癌症中频繁发生(图4)。有趣的是,尽管10个匹配的乳腺样本中有1个(10%)在所有监测的重复中全部获得或全部丢失,但约40%的儿科样本(ALL中5/12,髓母细胞瘤中7/17)全部获得或全部丢失,表明模式更加协调。总体而言,在所有阵列中观察到的增益和损失事件的频率大致相等,表明两者均可耐受。然而,一些收益的规模非常大(例如,1 Mb),并且增益幅度显著大于损耗(图5A)。我们推测,同样大的损失事件在着丝粒将不兼容的染色体传递,将丢失。基于阵列变化之间的不良成对相关性,成人癌症中的阵列不稳定性似乎对于每个阵列独立地发生(图5D和5F)。男性样品含有单个X染色体,因此含有单个阵列单倍型,而女性具有两个X染色体,并且测量值将代表两个阵列单倍型的平均值。如果平均两个单倍型掩盖了显著的拷贝数差异,那么当按性别对X染色体(DXZ 1、CT 45、CT 47、GAGE和DXZ 4)上的拷贝数测量值进行分层时,我们预期会发现然而,当按性别分层时,我们发现男性和女性正常组织中X染色体上的拷贝数之间无统计学显著差异(图S2A)。当比较雄性和雌性动物肿瘤和正常组织之间拷贝数变化的百分比时,两种性别之间无显著差异(图S2B)。基于这种分析,尽管样本有限,我们没有发现单倍型平均化掩盖拷贝数变化检测的证据。 最终,该领域将需要能够区分单倍型的工具。尽管成人癌症可能与生活方式有关并且具有高突变负担,但儿童癌症基本上是发育失调的疾病,并且经常与生长组织中的干细胞或祖细胞的表观遗传失调[29]与成人样本相比,儿童癌症显示出协调不稳定的特征阵列变化之间的成对相关性鉴定了X连锁串联重复序列的变化在髓母细胞瘤和ALL中彼此相关,但在髓母细胞瘤中显示与DXZ 1的低相关性(图5C和5E).此外,在ALL中,X连锁阵列的变化与其他染色体上的着丝粒阵列髓母细胞瘤的WNT亚组显示出增加的趋势,尽管样本数量较少(图4C)。当ALL样本进一步细分为男性和女性时,我们观察到男性X染色体上的基因重复与女性中的着丝粒DXZ 1阵列的相关性不高(图S3)。因为男性中的X连锁阵列存在于单个单倍型中,并且IGH-DUX 4男性癌症样品被确定为具有正常倍性,所以这些样品中X染色体上阵列的拷贝数变化为癌症基因组中个体阵列的扩增和收缩提供了最佳证据(图S3C)。这些协调不稳定性的迷人趋势将需要额外的验证,但建议选择可能在儿科癌症中对这些串联阵列起作用。总之,这些数据表明,串联重复,特别是着丝粒阵列,代表了癌症基因组中的不稳定区域。我们分析了阵列不稳定性与儿童癌症染色体不稳定性的相关性,因为我们有倍性信息。ALL样品分为两种亚型:超二倍体ALL,其特征在于非随机获得的6Cell Genomics1,100064,2021会开放获取技术图3.匹配样本散点图包含指示每对样本相对于正常的癌症变化将绝对拷贝数差异按比例缩放至正常组织的起始阵列的大小。(A) 散点图描绘了35个头颈癌样品中五个所示着丝粒阵列(B) 散点图描绘了10个乳腺癌样品的五个指示的着丝 粒 和 四 个 串 联 重 复 的 基 因 阵 列 ( DXZ 4 、GAGE、CT 45和CT 47)的百分比变化。(C) 散点图描绘了17个成髓细胞瘤样品的5个所示着丝粒阵列和5个串联重复基因家族(DXZ 4、GAGE、CT 45、CT 47和45S rDNA)的变化百分比。(D) 散点图描述了在12例急性淋巴细胞白血病样本中,5个指定的着丝粒阵列发生变化。红色C D虚线表示20%的误差窗口,该方法;在该范围内的测量值被认为“不显著”。染色体,包括6、10、14、21和X、30和IGH-DUX 4ALL,其通常具有整倍体基因组,染色体非整倍性、染色体碎裂或大染色体异常的发生率低。31重要的是,对于我们的分析,本研究中所有IGH-DUX 4病例均不存在染色体异常,超二倍体病例具有6、18和X染色体的复发性获得。成神经管细胞瘤样本包括四个不同的遗传亚组(WNT,n = 7; SHH,n = 4;组3,n = 3;和组4,n =3),其中6/7的成神经管细胞瘤样本中的神经管细胞瘤样本包括四个不同的遗传亚组(WNT,n = 7; SHH,n = 4;组3,n = 3;和组4,n = 3)。WNT样本显示6号染色体缺失。将所有儿科样本结合在一起,我们发现非整倍性事件与相应染色体上的重复不稳定性之间没有相关性(图S4),表明检测到的拷贝数变化是结构变异,与染色体数量增加或丢失不同。尽管如此,我们推测活性着丝粒阵列中的主要丢失事件可能导致相应染色体的丢失,在ALL的两种不同亚型中的染色体阵列变化(图S5A),没有统计学显著差异,再次与独立于染色体数目获得/丢失发生的拷贝数变化一致。此外,我们比较了丢失6 号 染 色 体 的 WNT 髓 母 细 胞 瘤 样 品(6/7)与其余髓母细胞瘤样品之间的D 6Z1阵列变化,未发现统计学差异。我们的观察结果支持了着丝粒阵列大小变化与相应染色体的倍性变化无关。我们进一步分析了阵列不稳定性如何与癌症类型或阶段相关,承认几次比较的样本量我们结合了每个髓母细胞瘤亚组的所有着丝粒阵列变化,并比较了亚组。我们发现WNT子组的总体阵列损耗比其他三个子组少(图-ure S5 B),但需要更多的样本来进一步探讨这一点。根据先前的分析,将头颈癌样品分为四个阶段,从早期(I期)到晚期(IV期)。32当我们按阶段对着丝粒阵列变化进行分组并进行比较时,我们发现各阶段之间没有显著差异(图S5C)。目前研究的样本量有限,无法提供足够的把握度来识别与分期的显著相关性需要对不同癌症阶段和类型的个体进行大样本量的进一步研究这是一个我们无法检测到的事件,因为染色体会从种群中丢失当我们把中心-以确定这些关联并告知如何在遗传学上使用着丝粒阵列变化。一BCell Genomics1,100064,2021年12月8日7会开放获取技术A图4. 阵列的重大变化,每个单独网格图表示每个匹配样本的变化百分比和相对变化由变化的百分比(红色是增益,蓝色是损失)和p值(点大小)缩放。(A) 显示了35个头颈癌样品中(B) 显示了10个乳腺癌样品的5个着丝粒和4个串联重复基因阵列(DXZ 4、(C和D)分别显示了17个髓母细胞瘤样品(C)和12个急性淋巴细胞白血病样品(D)的五个指定的着丝粒阵列和五个串联重复的基因阵列(DXZ 4、GAGE、CT 45、CT47和45S rDNA)的成神经管细胞瘤样本-按性别分为四个亚组:WNT(n = 7),SHH(n =10),BC4)、组3(n = 3)和组4(n = 3),如前所述。2885.7%(6/7 )的WNT样本存在6号染色体丢失。所有样品由超二倍体(n = 6)或IGH-DUX 4(n = 6)定义。高-超二倍体ALL样本显示染色体的非随机获得,其包括染色体6、10、14、21和X。在本研究中,6、18和X染色体的增加很常见(见表S4)。重要的是,该方法标准化了染色体拷贝数。D基因重复拷贝数是可塑的癌症基因组39并将其扩展到儿科癌症。讨论与171-bp的低转录着丝粒重复序列相反,核糖体DNA以非常大的45-kb重复序列编码基因组中最高转录的基因。编码45S基因 的核 糖体 DNA 串 联重 复序 列位 于 5个 近端 着丝 粒染 色 体(Chr13、14、15、21和22)的短臂上,并且显示减数分裂和有丝分裂不稳定性。此外,45S基因重复序列是癌症中的重组热点。34几个研究小组报告说,45S重复序列在许多类型的癌症中丢失。32,35-我们观察到11/29或38%的病例丢失ALL和成神经管细胞瘤(图4C、4D和5A)。但有5例(17%)拷贝数明显增加.这些数据共同证实了45S的观察结果在这项研究中,我们开发了简单的定量ddPCR检测方法,用于测量X染色体上的五个着丝粒阵列,三个串联基因重复阵列和一个大卫星阵列的拷贝数。我们将这些检测应用于群体样本,证明了在诱导中广泛的拷贝数变异单个人着丝粒阵列和存在于人群中的阵列组合的重复性。稳定性在正常组织细胞培养条件下观察到的着丝粒阵列的不稳定性与原发性人类癌症样品中的不稳定性形成鲜明对比。这项工作也代表了迄今为止对癌症中着丝粒阵列稳定性的最全面的定量分析,并证明了癌症中着丝粒阵列的不稳定性。本 研 究 中 的 重 复 序 列 在 大 小 上 不 同 于 微 卫 星 重 复 序 列(245S、CT 45、CT 47和GAGE),大卫星重复序列(例如,DXZ 4)和α-卫星着丝粒重复序列。我们建议用类似于MIN(微卫星不稳定性)的术语来表示这些序列类别的不稳定性,例如我们在成人癌症样本中观察到一种看似随机的不稳定模式,8Cell Genomics1,100064,2021会开放获取技术图5. 癌症基因组串联重复序列拷贝数变化的相关性(A) 描绘了每个阵列的显著拷贝数变化的平均大小(按百分比),并对所有癌症类型进行求和每个类别中的数字显示在条形图上,增益大小的偏倚是否显著通过基于Wilcox秩检验的Ranksks表示(**p<0.05,*p = 0.01,*p <0.001)。(B) X染色体上串联重复阵列的染色体定位示意图。(C-F)代表斯皮尔曼相关性的热图系数为的副本number癌症患者串联重复序列的C D变化类型:(C)乳腺癌,(D)髓母细胞瘤,(E)急性淋巴细胞白血病,(F)头颈癌。人类着丝粒序列一直很难表征,还有很多东西要学。令人兴奋的是,这些新的ddPCR检测方法将允许研究人员在更多的疾病状态和样本中分析着丝粒拷贝数,并具有高度的准确性。活泼和速度。带测量杆,一方面,我们可以开始思考着丝粒阵列变化的功能相关性。例如,在杂交小鼠中的实验已经证明,着丝粒大小可以充当减数分裂驱动器。13,40一些着丝粒阵列表位等位基因可能比其他基因更有效地进行染色体传递。8着丝粒定位的蛋白质可能正常地保护着丝粒阵列免于发生重组事件,41但这些蛋白质中的许多在癌症中变得失调,42表明重组事件可能增加。未来效益到审查着丝粒排列在儿科癌症中,X染色体上的α-卫星DNA(DXZ 1)、基因重复和微卫星重复的变异,这些标志值得进一步研究。我们对这些模式的理解还处于起步阶段,因为这些序列现在才能进行拷贝数评估,但代表了发现未被发现的基因组不稳定性事件和未被探索的潜在生物标志物的令人兴奋的前沿。某些类型的不稳定事件是由功能丧失驱动的,特别是在病理条件下的分子维持过程。例如,癌症中的MIN特征通常由错配修复的丧失驱动。未来的努力,以了解是什么驱动不同类别的重复拷贝数变异将是重要的,以了解机制,保持这些染色体区域的完整性。本文所述的直接、准确和快速的测定将极大地有助于稳定性和异质性该研究这项研究存在技术限制和知识空白。检测代表性扩增子以测量拷贝数的引物的设计基于以下假设:构成阵列的重复序列在个体之间具有高序列这是一个合理的假设,因为卫星DNA序列通常是通过协同进化产生的。这种进化模式导致基因组内重复序列的同质化和生殖群体成员的固定43人类着丝粒阵列可以通过在个体之间基本上不变44随机Cell Genomics1,100064,2021年12月8日9会开放获取技术发生突变和转座因子插入,但预期个体间的主要差异是扩增和收缩,具有相当稳定的核苷酸谱。可能比单核苷酸变异更可能发生的另一种类型的序列变异是高阶重复变异。典型重复序列占CHM中DXZ 1阵列的92%以上13,3,使得DXZ 1相对直接地用ddPCR测量。然而,重复变异可以发生在着丝粒阵列中。4,7人类群体中着丝粒阵列中高阶重复变异的频率才刚刚开始出现。7变异重复可能使ddPCR数据中以Mb为单位的阵列大小的计算复杂化。尽管变异重复序列仅占本研究中分析的阵列整体的一小部分,但基于CHM13 v1.0版本,如果变异重复序列的大小与规范高阶重复序列的大小不同,则扩增子拷贝数可能与总阵列大小(Mb)不直接相关。例如,DXZ 1中的一个高阶重复变体是2,000 bp,而典型重复是2,200 bp。重要的是,每个扩增子的拷贝数考虑到这些限制,未来设计扩增子以测量额外阵列的拷贝数和大小的努力应考虑到变异的证据,并将继续需要严格的基准测试。虽然ddPCR可以测量给定重复序列的平均拷贝数,但个体的每条染色体具有两种着丝粒单倍型。有证据表明,在种群水平上,着丝粒阵列具有高度的单倍型多样性。1,6,7我们的方法测量平均单倍型拷贝数,并且不能区分母本和父本单倍型,除了雄性样品中的DXZ 1此外,肿瘤细胞群体可以是异质的,并且可能在细胞之间的重复DNA中包含异质性。鉴于可用于分析人类基因组和癌症基因组计划的大量短读段序列数据人类着丝粒领域的未来挑战是开发工具来解析单倍型并量化短读段测序数据和单细胞中的着丝粒大小。此外,本研究中开发的测定和测量的阵列需要用额外的测定和数据来增强,以实现不同类别串联重复序列的稳定性的全基因组视图,以及它们在癌症和其他人类疾病背景中更广泛的突变特征STAR+方法本文件的在线版本提供了详细的方法,包括以下内容:d关键资源表d资源可用性B电极导线触点B材料供应情况B数据和代码可用性d实验模型和子系统B人类细胞系BDNA从去识别人类患者d方法样本BDNA提取B通过ddPCR进行的着丝粒和串联重复阵列定量d量化和统计分析补充信息补 充 信 息 可 以 在 www.example.com 上 找 到 https://doi.org/10.1016/j 。xgen.2021.100064。致谢这项工作的资金由堪萨斯大学癌症中心和Stowers医学研究所(J.L.G.)的试点赠款提供,英国癌症研究中心(J.C.,南卡罗来纳州,S.L.R.,南加州大学 ,和 C.J.H. ) ,英 国 血 液癌 症 (C.J.H. ) ,NHGRI ( R01HG011274 ,K.H.M.),国家自然科学基金(81771056、81972533)、广东省高水平医院建设财政资金(174-2018-XMZC-0001-03-0125/D-13)、中山大学中央高校基础研究基金(20 ykzd 09)(B.X.)。作者贡献概念化,L.G.L.E.H.,和S.L.R.;数据管理,L.G.L.,S.L.R.,J.C.,南卡罗来纳州,和S.C.C.;形式分析,L.G.L.,H. L.,S.L.R.,S. C.;资金来源Sition,J.L.G.,S.L.R.,C.J.H.,和S.C.C.;调查,L.G.L.,E.H.,和S.L.R.;方法论,L.G.L.,E.H.,S.L.R.,J.C.,S. C.;项目管理,S.L.R.; 资源:V.P.S.,TP B.X.,KHM,S.L.R.,南加州大学,和C.J.H.;超视觉,K.H.M.;可视化,L.G.L.;书面S.L.R.,和J.L.G.;写作S.L.R.,J.L. G南加州大学,和C.J.H.申报利益作者声明没有竞争利益。投稿时间:2021 - 01 - 14修订日期:2021受理时间:2021发布时间:2021年12月8日引用1. Langley,S.A.,Miga ,K.H.,Karpen ,G.H.,和兰利,C.H.(2019年)。跨越着丝粒区域的单倍型揭示了大块古老DNA的持续存在. eLife8,e42989.2. 贾恩,M.,奥尔森,H.E.,特纳,D.J.,Stoddart,D.,Bulazel,K.V.,Paten,B.,Haussler,D.,Willard,H.F.,Akeson,M.,和Miga,K.H.(2018年)。Y染色体上人类着丝粒的线性排列。国家生物技术 36,321-323。3. Miga,K.H.,Koren,S.,Rhie,A.,Vollger,M.R.,Gershman,A.,Bzikadze,A.,Brooks,S.,Howe,E.,Porubsky,D.,佐治亚州洛格斯登等人(2020年)。一个完整的人类X染色体的端粒到端粒组装。Nature 585,79-84.4. 佐治亚州洛格斯登,Vollger,M.R.,Hsieh,P.,Mao,Y.,Liskovykh,文学硕士,Koren,S.,Nurk,S.,默丘里湖Dishuck,P.C.,Rhie,A.,等人(2020年)。完整的人类8号染色体的结构、功能和进化。bioRxiv.https://doi.org/10.1101/2020.09.08.285395网站。5. Mahtani,M.M.,和Willard,H.F.(1990年)。人类X染色体着丝粒α-卫星DNA的脉冲场凝胶分析:高频多态性和阵列大小估计。Genomics 7,607-613.10Cell Genomics1,100064,2021会开放获取技术6. Miga,K.H.,牛顿,Y.,贾恩,M.,Altemose,N.,Willard,H.F.,肯特,W.J. (2014 年 ) 。人 类 X和 Y染 色 体随 体 阵 列 的 着丝 粒 参 考 模 型。Genome Res. 24,697-707.7. 铃木,Y.,Myers,E.W.,和Morishita,S.(2020年)。人类着丝粒重复序列结构的快速和持续进化。Sci. Adv. 6,eabd9230.8. Aldrup-MacDonald,M.E.,郭法医沙利文,L. L.,Chew,K.,沙利文,B.A.(2016年)。α卫星DNA内的基因组变异影响亚稳定表观等位基因在人类染色体上的着丝粒位置。Genome Res.26,1301-1311.9. Drpic,D.,阿尔梅达,AC,Aguiar,P.,Renda,F.,Damas,J.,Lewin,H.A., Lar-kin,D. M.,Khodjakov,A.,和Maiato,H.(2018年)。染色体的分离受动粒大小的影响。Curr. 28,1344- 1356.10. Dumont,M.,甘巴河Gestraud,P.,Klaasen,S.,Worrall,J.T., DeVries,S.G. ,Boudreau ,V.,Salinas-Luypaert ,C.马多克 斯,附,Lens,S.M.,等人(2020年)。人类染色体特异性非整倍性受DNA依赖性着丝粒特征的影响。EMBO J. 39,e102924。11. Worrall , J.T. , Tamura , N. , Mazzagatti , A. , Shawn , N. , vanLingen,T., 巴克,B.,斯皮里,华盛顿特区,Vladimirou,E.,Foijer,F.,McClelland,S. E. (2018年)。人类染色体的非随机错误分离。CellRep. 23,3366-3380。12. Iwata-Otsubo,A.,Dawicki-McKenna,J.M.,Akera,T.,Falk,S.J.,奇马塔尔湖,杨,K.,沙利文,文学士,Schultz,R.M.,Lampson,MA,黑色,B.E.(2017年)。扩展的卫星重复序列扩增了染色体上驱动雌性减数分裂的 离 散 CEN
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 保险服务门店新年工作计划PPT.pptx
- 车辆安全工作计划PPT.pptx
- ipqc工作总结PPT.pptx
- 车间员工上半年工作总结PPT.pptx
- 保险公司员工的工作总结PPT.pptx
- 报价工作总结PPT.pptx
- 冲压车间实习工作总结PPT.pptx
- ktv周工作总结PPT.pptx
- 保育院总务工作计划PPT.pptx
- xx年度现代教育技术工作总结PPT.pptx
- 出纳的年终总结PPT.pptx
- 贝贝班班级工作计划PPT.pptx
- 变电值班员技术个人工作总结PPT.pptx
- 大学生读书活动策划书PPT.pptx
- 财务出纳月工作总结PPT.pptx
- 大学生“三支一扶”服务期满工作总结(2)PPT.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功