没有合适的资源?快使用搜索试试~ 我知道了~
技术多患者靶向单细胞DNA测序重建乳腺癌突变谱系图形摘要亮点d开发了定制的靶向面板,以通过scDNA-seqd来自5名三阴性患者的d使用基于微流体的scDNA-seq将MPT应用于23,500个细胞中的330个突变d重建的突变谱系和乳腺癌演变作者作者:Jack Leighton,Min Hu,EmiSei,Funda Meric-Bernard,NicholasE.Navin对应nnavin@mdanderson.org简言之Leighton等人开发了一个多患者靶向(MPT)面板,以通过使用来自癌症患者的合并突变合成定制靶向面板来分析单个癌细胞中信息丰富的突变位点,所述癌症患者首先通过批量外显子组测序进行分析。与微流体平台上的高通量scDNA-seq一起,应用MPT来分析来自5名三阴性乳腺癌患者的23,500个细胞中的330个突变。这重建了突变谱系和拷贝数事件,包括在所有五名患者中观察到的早期TP53突变,这是乳腺癌演变的基础。Leighton等人,2023,细胞基因组学3,1002152023年1月11日-2022年作者。https://doi.org/10.1016/j.xgen.2022.100215一1BCD来自多个患者的BETNBC患者A N突变2CN突变DN突变N突变合并患者的突变EN突变ABCDE合成单个自定义MPT面板一MPT3BCDE单细胞DNA测序个别患者使用~5000 MPT面板单细胞TNBC患者TNBC患者x突变会会开放获取技术重建突变谱系通过多患者靶向单细胞DNA测序,杰克·莱顿,1,2,3胡敏,1,2Emi Sei,1,2Funda Meric-Bernard,3,4和Nicholas E.纳文1,2,3,5,6*1遗传学系,UT MD安德森癌症中心,休斯敦,TX 77030,美国2系统生物学系,UT MD安德森癌症中心,休斯敦,TX 77030,美国3生物科学研究生院,UT MD安德森癌症中心,休斯敦,TX 77030,美国4精确肿瘤学系,UT MD安德森癌症中心,休斯敦,TX77030,美国5生物信息学和计算生物学系,UT MD安德森癌症中心,休斯顿,TX 77030,美国6引线触点* 通讯地址:https://doi.org/10.1016/j.xgen.2022.100215nnavin@mdanderson.org总结单细胞DNA测序(scDNA-seq)方法是分析癌细胞突变的有力工具;然而,在单细胞中测序的大多数基因组区域是无信息的。为了克服这个问题,我们开发了一种多患者靶向(MPT)scDNA-seq方法。MPT涉及首先在一组癌症患者中进行批量外显子组测序,以识别体细胞突变,然后将其汇集在一起,使用微流体平台开发用于高通量scDNA-seq的单个定制靶向面板我们应用MPT分析了来自5名三阴性乳腺癌(TNBC)患者的23,500个细胞中的330个突变,结果显示3个肿瘤是单克隆的,2个肿瘤是多克隆的。根据这些数据,我们重建了突变谱系,并确定了早期突变和拷贝数事件,包括所有5名患者中发生的早期TP53突变总的来说,我们的数据表明,MPT可以通过分析信息丰富的突变位点来克服使用scDNA-seq研究肿瘤演变的介绍三阴性乳腺癌(TNBC)是一种侵袭性亚型,其特征在于缺乏雌激素受体(ER)、孕酮受体(PR)和Her2受体水平。TNBC患者经常对化疗产生耐药性(约50%),并进展为转移性疾病,通常导致生存期差。1-3与ER阳性乳腺癌相比,TNBC患者在83%的患者中显示 出广泛的拷贝数改变(CNA)和TP 53的驱动突变。4此外,单细胞DNA测序(scDNA-seq)、多区域测序和全基因组测序方法显示TNBC患者显示出广泛的肿瘤内异质性(ITH)。 58 , 9先前的研究表明,TNBC通过间断拷贝数进化(PCNE)进化,其中在进展的最早阶段,在进化的短爆发中获得大量的CNA事件。3,5,10,11然而,TNBC进展期间突变的动力学和时间代表了知识的根本差距。此外,提高对ITH的认识对于TNBC患者的临床诊断和治疗是重要的,特别是在选择靶向治疗时。在研究和临床研究中获得更广泛使用的一种解决肿瘤内异质性的方法是scDNA-seq。12在过去的10年中,单细胞基因组学领域13初始scDNA-seq用于分析单细胞的基因组和外显子组的方法是低通量的,并且具有广泛的技术误差。14-20-类似地,已经使用微流体平台(MissionBio,Tapestri)开发了用于突变谱分析的26-31然而,与涉及稀疏深度的无偏全基因组测序(WGS)的基因组拷贝数分析相反,突变分析需要高覆盖率数据。因此,需要靶向基因组区域进行测序(例如,外显子组,癌症基因组),以使这些Cell Genomics3,100215,January 11,2023? 2022作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取技术2Cell Genomics3,100215,2023一患者A患者B患者C患者D患者EN突变N突变N突变N突变N突变步骤1来自多个患者的肿瘤的批量外显子组测序BC一BCD E合并5例患者合成多患者靶向(MPT)检测板一BCD E患者一BC D E ABC D E ABC D E ABCD E步骤2从病人身上收集突变,MPT面板步骤3单细胞DNA患者A患者B患者C患者D患者E个体患者使用MPT面板~5000单细胞~5000单细胞~5000单细胞~5000单细胞~5000单细胞(图例见下页)单细胞DNA测序X突变X突变X突变X突变X突变X突变Cell Genomics3,100215,2023年1月11日3技术会开放获取经济上可行的分析这提出了一个主要的挑战,因为信息突变位点通常不是先验已知的,因此在单细胞中分析的大多数基因组区域仅包含参考DNA序列或种系SNP。为了应对这一挑战,我们开发了一种多患者靶向(MPT)scDNA-seq测序方法,该方法结合了批量DNA测序、基于单细胞液滴的微流体和定制靶向面板。我们将MPT应用于5个侵袭性TNBC肿瘤样本,其解析了肿瘤的克隆亚结构,并使得能够在肿瘤进展期间重建克隆谱系。 我们的数据显示,TP53突变和TNBC进展中的其他早期突变事件伴随着CNA事件,导致原发肿瘤块的扩大。此外,我们的数据表明,大多数突变是TNBC肿瘤进展的早期事件,亚克隆在稳定的克隆扩增下仅具有有限的中间突变。在肿瘤生长过程中获得结果MPT板测序肿瘤中突变的靶向scDNA-seq的主要挑战是通常只有少数体细胞突变(例如,1-10)可以使用覆盖小区域(例如,5Mb),而测序的大多数基因组区域仅包含参考基因组碱基和SNP。这个问题导致scDNA-seq区域的高成本,而有用的突变信息有限,并且禁止大量细胞在分子水平上进行分析。为了解决这个问题,我们开发了一种称为MPT测序的方法(图1)。在这种方法中,我们首先分析一组患者(例如,5- 20)约400个突变),以开发针对scDNA-seq的定制靶向组,其靶向所有患者中的所有突变位点(图1A)。在微滴平台(Mission Bio)的未来发展中,更大的扩增子组(例如,数千个靶)将允许更多的患者被剖析或每个患者更大数量的突变位点被剖析。为了下游scDNA-seq的目的,使用微流体平台(Tapestri,Mission Bio)商业合成定制组(V1定制靶向组,Mission Bio)(图1B)。然后,我们使用相同的MPT组对先前通过批量外显子组测序分析的每个肿瘤进行scDNA-seq(Mission Bio),以分析每个肿瘤的约5,000个细胞(图1C)。在对每种肿瘤进行的scDNA-seq实验中,对每名患者的突变进行分析(例如,约50个突变),以及其他患者中突变的参考位点(其未用于下游分析)。MPT方法的主要优点是它极大地减少了非信息性基因组信息的测序空间,而这些信息通常使用无偏面板进行分析值得注意的是,当相同的突变发生在不同的患者中时,这些位点将在自定义MPT面板上节省额外的空间。通过将scDNA-seq集中在感兴趣的突变位点上,测序成本大大降低,从而能够以低成本对每个患者并行进行数千个单细胞的高通量分析TNBC的批量外显子组测序我们选择来自5名未治疗的TNBC患者的冷冻浸润性肿瘤样本(导管原位癌[DCIS]/浸润性导管癌[IDC]),这些患者的ER、PR和Her 2受体水平(通过免疫组织化学评价)和Her 2扩增(通过细胞遗传学分析评价)均为阴性,用于批量外显子组测序,然后使用微流体系统(Tapestri,Mission Bio)进行MPT分析(表S1)。为了富集大量肿瘤细胞群,我们首先产生单核悬浮液并用DAPI染色细胞核以进行荧光激活细胞分选(FACS)(图2A)。使用FACS,我们门控2.65-3.7(N)倍性的细胞使用非整倍体细胞,我们生成测序文库并在稀疏深度进行WGS以估计基因组拷贝数和外显子组捕获(Roche,Nimblegen v.2)以鉴定点突变(表S2)。基因组拷贝数谱显示所有肿瘤中广泛的非整倍性和拷贝数畸变(CNA),包括MYC等癌基因的扩增和TP 53等肿瘤抑制因子的缺失(图2B)。非整倍体分选的细胞核和匹配的正常组织的外显子组测序鉴定了肿瘤中的一系列体细胞突变(平均= 66),其中TN 4和TN 5显示出与TN 1-TN 3相比高度升高的突变负荷在不同类别的外显子突变中,错义突变在所有5个样品中是最普遍的(>70%),鉴定出较少数量的无义突变和剪接突变(图2C)。突变特征的分析显示,几种常见的乳腺癌特征是普遍的,包括特征1a/b、3、13和15(图2D)。标签1a/1b是老化(甲基胞嘧啶脱氨基),标签3是同源重组修复缺陷,标签13是APOBEC胞苷脱氨酶,标签15代表DNA错配修复。有趣的是,在TN 4中观察到的组群中的最高突变频率最后,我们研究了体细胞突变频率的分布,每例患者的频率范围为~0.1%至~99%,并显示TP 53是所有5例患者中鉴定的频率最高的突变之一(图2E)。我们组合了在5名TNBC患者中鉴定的所有体细胞突变,以设计用于scDNA-seq分析的定制MPT组(Mission Bio)。图1.多患者靶向单细胞测序工作流程(A) 对一组人肿瘤进行大量外显子组测序。(B) 将来自所有患者的突变汇集在一起并用于合成多患者靶向(MPT)定制组。(C) MPT板用于对每个患者单独进行单细胞DNA测序(scDNA-seq),以使用微流控平台并行分析数千个细胞。4Cell Genomics3,100215,2023会开放获取技术TBL1XR1MCL1LRP1BPIK3CAMTDHCCNE1ERCC2PLA2G10FOXK2GATA1IGF1RNRASRUVBL 1PAK1MDM2BRCA2TP53NF2TN21.000.750.500.250.00TN3P = 3.03D一TN1250N0004100N0006150N0008200N000DTN4一2500N004100 0N006150N00028000N00DTN2一P = 3.70250N0004100N0006150N0008200N000细胞计数#外显子突变TP 53BAP 1SIADARB2CASP8SLC8B1F8[C/A]F8[A/T]WBSCR22 RAPG E F6DDX60LTEKDCTPELP 1CACNA1BTLR4CROCCNDST 4SUN1ANKRD 24CDK 13DLC1SLC6A5PRKAA 1GALESLCO 3A1CSRP2BPIFIH 1RASAL2NCDNCFAP 61GIMAP6GAD 1PSMF 1C1S SPTA1ADAMTS10 SMYD1CCDC178GMPPALYSTOCRLOR2Z1GTF3C3PLCH1ADAMTS16 GPR158BCORL1DLG2SENP 2ADCY 8GPR98SLC2A4FRG 2BLTA4HOTUD 5PODXL2PIN4PLXNA2RGS7MS4A14PRIM2CTBSOR4A16[T/C]OR4A16[A/G]IQGAP 3KIAA1462RASGRP 4OR8U1MUC6[G/A]ARID4ACASP6PRDM 5VWDEMUC6 [C/T]MUC6 [C/G]ITFG 1MUC6[C/A]FUT4SERPINA10MUC1 6 [G/A]HIVEP2MUC1 6[T/G] KMT 2DMARCH 6ACTN 1CELSR 1CPNE 7PLP 1TBX4BICD1KANK4DNAH9TP53FBXO38DNAH1OMPPLEKHA6ARHGEF17ACSS1DGKZUTRNCHTF18C10orf12SLC35F1IGFALSRASGRF2HELZ2STXBP2AMDHD2SLC2A2ZNF687TBX1PRIM2MUC6[G/T]RIMS2MED24PDE4DIP[C/T]PABPC3PDE4DIP[C/G]RP11[T/A]MAP2K3MUC6[T/G]MUC6[A/G]OR2T8RP11[T/C]MUC6[T/C]RP11[G/T]A CMutation classesDMutation signatures3002001000200D15010050P = 3.76一 TN33002001000200100P = 3.45300200100P = 2.65100500类3UTR内含子错义NMD无义剪接未知1.000.750.500.250.00签名发病年龄(1A)发病年龄(1B)HR缺乏(3)乳房/不详(8)国际开发署/APOBEC(13)DNA错配(15)未知0COX6C00TN1 TN2 TN3 TN4 TN5TN1 TN2 TN3 TN4 TN5250N0004100N0006150N0008200N0002N4N6N8N患者肿瘤样品DNA倍体BDNA倍性TN1TN2TN3TN4Tn5E拷贝数8+76543211.000.750.500.250.001.000.750.500.250.001.000.750.500.250.001.000.750.500.250.00TN1TN4Tn5基因组位置(Gb)基因图2.TNBC肿瘤的大量外显子组测序和突变分析(A) 将冷冻的肿瘤组织解离成核悬浮液,并用DAPI染色用于FACS,以通过DNA倍性的差异分离非整倍体单细胞,其中P表示平均肿瘤倍性,D和A分别表示二倍体或非整倍体分布。(B) 从来自每个肿瘤样品的单细胞WGS数据生成的伪批量拷贝数比率图,计算整数拷贝数状态(C) Annovar确定的每种肿瘤的外显子突变类别(D) 从外显子突变计算的突变特征。(E) 用于设计MPT组的每个TNBC肿瘤中鉴定的所有体细胞突变的等位基因频率TNBC肿瘤的突变亚结构为了解析每个TNBC肿瘤的克隆亚结构,我们应用MPT组,使用microdroplet(Mission Bio)scDNA-seq平台对5个肿瘤的总共23,526个细胞(范围:4,002 - 5,941)进行scDNA-seq与批量测序相反,scDNA Mission Bio实验全部在未分选的细胞上进行(未进行FACS)。所得数据显示,330个靶向位点(STAR方法;表S3)在5个肿瘤中具有164× 3的覆盖深度。通过使用GATK的从头变体调用,独立于也使用GATK进行变体调用的外显子组批量数据(STAR方法),在每个单细胞在多克隆肿瘤TN4中,4,141个单细胞聚集使用均匀流形近似和投影(UMAP),在69个基因中鉴定了对应于三个肿瘤亚克隆(c1-c3)和一个二倍体细胞群体(c4)的高维空间中的4个主要簇突变的聚类热图进一步揭示了体细胞突变在每个亚克隆中,包括存在于所有三个肿瘤簇中的共有突变(图3B)。该分析鉴定了在所有三个亚克隆中共有的15个纯合突变,包括TP53,其是TNBC中最常见的突变基因。4从读取深度估计靶向组上每个基因的拷贝数,其鉴定染色体获得和损失(STAR方法)。这些数据表明,GRIN3A,DMKN和IGSF10被扩增,而NOTCH 3和其他15个纯合突变基因显示拷贝数丢失。使用CADD对功能影响评分的计算预测鉴定出KALRN、N0TCH3和PTPN 4在其他基因中具有最高的功能影响评分(图3C)。32为了推断肿瘤演变过程中单核苷酸变体(SNV)和CNA的时序和顺序,从突变矩阵构建邻接(NJ)树,之后注释突变和CNA事件(STAR方法)。NJ树显示了三个主要的分支点:最近共同祖先(MRCA),第一亚克隆祖先KAT6BFGFR2MCL1SHC1MTDHCCND1FOXK2MED12FHITCOX18PARP10BRAC2TP53TNFAIP3SMYD3MycPIK3CAGATA3IGF1RZNF217NRASLRP1B FGFR3PHF3KRASBRCA1CCND3MCL1MYCNCDK6FAT1GATA3PTPN6KRASJAK3NRASMST1R FGFR3MDM2BRCA2IGF1R TP53STK11NF2CDKN2BKLF4ZNF521CKS1BPIK3CARUVBL 1NFIBFAT1ANKS1BCEBPARPL 10CDK6FHITFGFR3FGFR4 CSMD 1CDKN2ACDKN1BFoxa1TP53NF2D一Tn5拷贝数细胞计数拷贝数比(log2)等位基因频率MYO 18 ARTL1XIRP1[C/G]ZMAT 1TP53COL5A3RP1L1DHRS11SHCBP1LTESK2PLEKHG5TMEM 2FUK ZFHX4 [G/A]USP21 NBNMAMDC 2RUVBL 2SULT1E1KRT12XIRP1[C/T]NAP 2KCNJ 18DICER 1HERC6FAM196ADNAH3 CD7DCCSERTAD1KDELR2ZFHX4[G/T]TMTC1GJB4EDARADDSEMA5AENPP3KAT6APRIM2PXDNSEC22BAP1M1GZMBNAT9MEFVGALCRYR1LRRC8CZBTB38CDS1TP53OSMBRD8SLC13A5PLA2G2FPABPC5ABCC10CACNA1BRASAL2TAS1R3PROCRDIDO1KMT2EARFGAP 1KCNJ 18[G/T]TECPR 1LOC 100996758附件NPHP1PDE4DIPKCNJ18[G/A]SEC22b公司简介POMT 2C17o rf96SBNO2RP1L1ARPC5LC12o rf66TP53WSCD2AKAP6CAPN6FAM4 7 EFMNL 3Gad2公司简介HDAC8EYA 3KRT73SLC3 9A 1 2Grid2CACNA1DZNF51 8AWIBGTPPP3GRIN3AITIH3MAP3K1SAMD11ATP 6 V 0E 2TM E M1 1 5PLATZBTB41ITGALKCNQ5MLL T 1SNAP91SHANK1SUP T2 0HUBE2J1ANK RD 34 CERC1PEX6胰岛素样生长ATP 6 V 1C 2ICKRGSL 1ANK DD 1AHMCN1UMPSACIN 1Gab1PTPN4MS4A10Sox6TTBK 1GBP5MFSD2A签名分数PLCB 4FGFBP3SLC2 2A 1 0LZTS1NRBP1ECEL 1ARHG A P 4IGSF10ZFPM2GRIN2CCNGB3FADS6AdarCACN A 1BSMA RC C 2DOCK7PDHXRHBDF1THNSL2MRG P R GPNPLA7CLNKXIRP2NLE1SLAMF1PBXIP1PSPHYIPF4FRG 2OPLAHZSCA N 22ARID1BUSP29DDR2Notch3DZIP3HECTD4Rp1CHD7LNPEPSUPT6HCABIN1ECE2EPB 4 1L 2KMT2COBSCNBCRCACNA1FhocT3POTEMGPR31TMEM31KALRNKCNB2MINPP1 涅茨公 司 简介PPP 1 R1 4 ACUL4BDSTFHL2TOP B P 1TSNAXGO L G B 1ABCA4ARH G DIATA S 2R 38KCN MB 2DMKNCALD1TDRD9FAM 1 74 BCell Genomics3,100215,2023年1月11日5技术会开放获取A BTN4AFCN1CN2AF100806040200CN比率10UMAP-1簇/亚克隆c1C2C3C4体细胞突变纯合杂合参照CDKALRNNOTCH3PTPN4ACIN 1拷贝数TP53TP53NOTCH3 GRIN3ACALD1KRT73ZFPM2EYA3TOPBP1UBE2J1扩增缺失*WGDDMKNPTPN4GRIN3AAKAP 6GBP5RGSL1GBP5ANKRD34CFAM47ECALD1SUPT6HPLCB4C12orf66ZNF202TP53LNPEPANKRD34CDOCK7GAD2AKAP6RGSL 1CALD 1ZBTB41EPB41L2ITIH 3ABCA 4CAPN 6GBP5GRIN 3ADMKNFAM47 E 0 10203040集群C1C2C3C4突变MRCAA1ZNF 202KALRNDMNKNotch32CADD评分(>15 -前5%)E FTN2AFCN1CN2AF100806040200CN比率10簇/亚克隆c1C2C3体细胞突变纯合杂合参照UMAP-1G HZFHX4[G/A]TP53TP53ZMAT 1TP53ZMAT 1RUVBL 2 KDELR2 KRT12DCCSULT1E1切割器1RUVBL2ZMAT1DCCKAT6APLEKHG 5FCSKDNAH3CEMIP 2ZFHX 4[G/T]KRT12KDELR2USP21TMTC1COL5A3FAM196A0 10 2030拷贝数扩增缺失集群C1C2C3突变*WGDMRCACOL5A3SULT1E1USP21TMTC1ZFHX4[G/A]的1DICER1DICER1KRT12ZFHX 4[G/T]RUVBL 2CADD评分(>15 -前5%)(图例见下页)集群c1(肿瘤)c2(肿瘤)c3(正常)正常正常集群c1(肿瘤)c2(肿瘤)c3(肿瘤)c4(正常)Lo r e m4,141个单细胞5,172个单细胞显著基因显著基因UMAP-2UMAP-2肿瘤正常肿瘤正常集群NOTCH3XIRP2DMKNGOLGB1SMARCC2FGFBP3CLNKRTL1ZBTB41RGSL1KCNB2TSNAXCALD1DSTRp1TOPBP1BCR ABCA4 LNPEPDZIP3KALRNSLAMF1TMEM 115ANKRD34C ACIN 1USP 29PLATITIH3DOCK7EPB41L2ADARYIPF4CNGB3ERC1SUPT6HGBP5ECEL1GRIN3AUBE2J1KCNQ5ITGALTHNSL2ZFPM2ANKDD1ADDR2MFSD2ANLE1PLCB4IGSF10UMPSNRBP1PTPN4ICKMS4A10GAD2ZNF608FAM47EZNF202HDAC8TPPP3AKAP6TP53WSCD2KRT73FMNL 3C12orf66CAC31DEYA 3CAPN6集群KDELR2DCCDICER1KRT12ZFHX4[G/T]RUVBL2PLEKHG5脱氧核糖核酸3KAT6ACEMIP2INSYN2ATMTC1SULTIE1FCSKUSP21ZFHX4[G/A]ZMAT1TP53一COL5A36Cell Genomics3,100215,2023会开放获取技术(A1)第二个亚克隆祖先(A2)导致了三个肿瘤亚克隆(c1-c3)的分化。在所有肿瘤亚克隆中发生的主干突变包括TP53和N0TCH 3中的染色体丢失以及DMKN和GRIN 3A中的增加,而早期突变包括TP53、GRIN 3A、PTPN 4和AKAP 6。c3亚克隆最接近MRCA,表明它是最早分化的亚克隆之一,与聚类结果一致,聚类结果表明它具有最低数量的突变(n = 33)。C2克隆在A1祖先之后通过获得额外的一组突变而分化(n = 8)。最后,c3克隆通过获得大量体细胞突变(n = 28)从A2祖先分化,所述体细胞突变包括NOTCH 3中的突变(图3D)。有趣的是,在该分析中,在3个主要亚克隆之间鉴定出缺乏逐渐的中间突变,并且大多数突变在3个肿瘤亚群中是非常克隆的在多克隆肿瘤TN2中,共对5,172个单细胞进行了测序,并鉴定了19个体细胞突变。这些数据在高维空间中的聚类鉴定了3个主要簇,包括两个主要肿瘤亚克隆(c1体细胞突变的分层聚类鉴定了两个肿瘤簇之间共有的13个突变,包括3个纯合突变,其中一个是TP 53突变(图3F)。聚类热图还显示了c2亚克隆独有的6个突变,表明该亚群在共有的共同祖先之后继续进化额外的突变。应用来自读取深度数据的靶向拷贝数推断,我们鉴定了ZFHX 4[G/A]、USP 21和TMTC 1中的扩增,而TP 53、ZMAT 1和COL 5A 3显示拷贝数损失并具有纯合突变(图3F)。功能影响评分的CADD预测显示,ZFHX 4[G/A]、TP 53、SULT 1 E1和DICER 1在TN 2中具有最高评分(图3G)。构建了NJ树,显示了进化中的两个主要分支点:MRCA和A1。在MRCA之前发生的早期躯干事件包括TP 53、ZMAT 1和COL 5A 3中的染色体丢失,而增加包括USP 21、TMTC 1和ZFHX 4[G/A],突变包括TP53、ZMAT 1和SULT 1 E1(图3H)。c1克隆通过获得6个额外的突变(包括DCC、DICER 1和RUVBL 2)与c2分离,具有高功能影响评分。与TN4一致,TN2的突变亚结构显示在两个亚克隆和二倍体细胞之间检测到缺乏逐渐突变TN1、TN3和TN5的聚类揭示了由单个肿瘤细胞群体和单个二倍体细胞群体组成的单克隆肿瘤(图4)。在TN1中,在4,270个单细胞中检测到16个在TN 3中,数据标识-在TN5中,在5,941个细胞中检测到11个突变,而在TN5中,在4,002个细胞中检测到47个突变(图4A和4B)。在TN1中,具有最高影响评分的突变包括TP53、CDS1、RASAL2和ARFGAP1 中 的 纯 合 突 变 , 而 在 TN3 中 , 这 些 突 变 包 括 TP53 、PLEKHA6、STXBP2和MED 24。在TN5中,在TP53、RGS7和NDST 4以及其他基因中鉴定出显著突变(图4C)。CADD分析显示TP53中的纯合突变在所有三种肿瘤中具有最显著的功能影响评分(图4C)。虽然在所有肿瘤细胞中检测到三种单克隆肿瘤中的大多数突变,但有少数突变以较低频率发生,包括TN3中的MED 24(4.8%)和TN5中的OTUD 5(3.2%)和PRDM 5(2%),以及TN5中的SENP 6、MARCH 6、PODXL2和ADCY 8(均为1.8%),表明这些是在肿瘤进展期间出现的较晚谱系事件。靶向拷贝数推断表明,纯合突变TP53、CDS 1、AP1M1、ZBTB38、PABPC 5和OSM在 TN1 中 缺 失 , 而 在 TN3 中 扩 增 PLEKHA6 , 在 TN5 中 扩 增TBX4、DLG 2和SPTA 1(图4B)。构建NJ树以推断SNV和CNA的时间顺序和顺序,这表明大多数事件是躯干性的,并且发生在MRCA之前,之后肿瘤细胞扩增以在每个患者中形成肿瘤块(图4D)。从单细胞和批量数据比较克隆亚结构为了理解MPT方法用于解析克隆子结构的优点,我们直接将5名患者的“伪批量”数据与单细胞MPT数据进行比较。为了评估拷贝数数据的准确性,我们首先计算了单细胞MPT数据的一致性,并将其与伪批量单细胞WGS数据进行比较,我们认为伪批量单细胞WGS数据是Pearson相关系数的计算显示患者之间的高相关值(平均值= 0.871),表明当跨细胞合并在一起时,单细胞MPT读段计数数据准确地反映了假批量WGS拷贝数谱。值得注意的是,在来自TN1(RASAL 2,NAT 9)、TN2(USP 21)、TN3(RIMS 2)、TN4(GRIN 3A)和TN5(IQGAP 3,SPTA 1、TBX 4、PIN 4)。接下来,我们比较了大量外显子组数据的变体等位基因频率(VAF)与组合的单细胞突变频率(图5B)。计算两组VAF的Pearson相关系数,结果显示5例患者VAF的Pearson相关系数均为0.876,说明VAF的Pearson相关性很好。最后,我们研究了大量外显子组数据的克隆组成是否可以通过聚类VAF图3.两种多克隆肿瘤的克隆亚结构和系统发育重建(A和E)使用4,141和5,172(TN4、TN2)个单细胞的UMAP对体细胞突变进行高维聚类以鉴定亚克隆的主要簇。(B和F)TN4和TN2中的分级聚类突变的热图,显示了肿瘤亚群内的克隆子结构和异质性,其中聚类水平的拷贝数估计显示在上面的标题轨道中。(C和G)CADD评分用于对TN4和TN2中突变的不利性的功能影响进行排名(D和H)使用邻接树对TN4和TN2中的突变谱系、年代学和相对于MRCA的拷贝数畸变的时间进行系统发育重建共同祖先(A1,A2)以及全基因组加倍(WGD)事件在树上注释。会开放获取技术Cell Genomics3,100215,2023年1月11日710ofr12CADARB2正常RASAL2ABCC10CDS1AP1M1TP53TP53CDS1ZBTB38簇c1(tumc2(noMED24STXBP2PLEKHA6正常TP53DNAH1簇c1(tumc2(noNDST 4TP53BCORL1 OTUD 5GPR158 PLCH 1正常TLR4BAP1TP53TBX4 DLG 2LYST IQGAP3SPTA 1GPR158簇c1(tumc2(noAFA B C DTN1UMAP-1or)rmal)AFCN100806040200CN比率10集群/rubclonesc1C2体细胞突变纯合杂合参照CDS1TP53RASAL2LRRC8CARFGAP1ABCC10AP1M1ZBTB38KMT2ENPHP1MEFVPABPC5OSMNAT9DIDO10 10 20 30TN3AFCNAF100806040200TP53PLEKHA6STXBP2SLC35F1UMAP-1or)rmal)CN比率10簇/亚克隆c1C2体细胞突变纯合杂合参照SLC2A2MED24DNAH1KANK4C10orf12RIMS2UTRN0 10 20 30UMAP-1or)rmal)Tn5AFCNAF100806040200CN比率10簇/亚克隆c1C2体细胞突变纯合杂合参照TP53BAP1DLG2NDST4RGS7LYSTADARB2GPR158PRKAA1ADAMTS16IFIH 1TBX4LTA4HIQGAP 3SMYD 1SLCO3A1RASGRP 4 PIN4CFAP 61BCORL1PRDM 5GAD 1CASP 8PSMF 1TLR4OTUD 5NCDNDCTSPTA 10 10 20 3040CADD评分(>15 -前5%)集群C1C2拷贝数扩增缺失突变图4.三种单克隆肿瘤的克隆多样性和突变谱系(A) 使用UMAP分别对4,270(TN1)、5,941(TN3)和4,002(TN5)个单细胞进行高维聚类,在每个样品中鉴定出一个主要肿瘤簇和一个正常细胞簇。(B) TN1、TN3和TN5中突变的分层聚类热图显示了肿瘤细胞的单克隆群体,标题栏中显示了每个突变的聚类水平拷贝数估计值。(C) CADD评分用于对TN1、TN3和TN5中突变的预测有害性影响(CADD >15,前5%)进行排名(D) 使用注释了MRCA的邻接树,对TN1、TN3和TN5突变谱系、时间顺序和相对于MRCA的拷贝数畸变时间进行系统发育重建。使用PyClone2(图5C和S4)。33这些数据显示PyClone2经常高估每个肿瘤中存在的亚克隆的数量,其中通过PyClone2估计两个单克隆TNBC肿瘤(TN1,TN2)具有3个亚克隆,并且显示一个单克隆肿瘤(TN4)具有1个亚克隆。对于两种多克隆肿瘤,Pyclone2在TN3的外显子组数据(单细胞3个,外显子组5个)和TN5的外显子组数据(单细胞2个,外显子组3个)中估计了更高数量的亚克隆。这些数据突出了基于VAF从大量外显子组数据估计亚克隆数量的挑战,单细胞突变数据可以准确解决。MPT基准测试指标为了对MPT方法的灵敏度和准确度进行基准测试,我们首先通过计算来自所有扩增子和细胞的覆盖度读数深度的基尼指数(GI)和变异系数(CV)来研究覆盖度的方差(图S1A、S1B和S2B)。扩增子的平均GI为0.32,而细胞的平均GI略高,0.51. 类似地,扩增子的CV为65.6,并且扩增子的CV为65.6。平均变异系数为125.3。此外,我们计算了每个相应扩增子的GI,以了解覆盖深度的靶特异性变化(图S2A)。这些数据表明,对于大多数靶位点,覆盖深度高于100 -3覆盖,并且显示出对应于靶基因组区域的显著变化,反映了整个基因组中扩增效率的差异(图S2B)。接下来,我们计算了所有样品的平均等位基因丢失百分比(约9%)、平均双联体频率(约8%)和成功扩增子的百分比(约85%),这表明单细胞数据集的性能指标良好(图S1接下来,我们通过将每个肿瘤样品的FASTQ文件从1003降采样到103覆盖率来测试MPT方法的稳健性(图S1F和S1 G)。该分析表明,随着覆盖深度的降低,扩增子中的大多数突变仍然被检测到,直到~603覆盖深度,其中在TN 4和TN 5中未检测到大量突变(603)。类似地,覆盖范围的下采样导致检测到的深度小于1003的细胞更少,TP53STXBP2PLEKHA6PLEKHA6MRCATP53TP53CDs1CDS1RASAL2MRCATBX4TP53SPTA 1BAP 1DLG 2TLR4TP53RGS7NDST4MRCA5,941个单细胞4,002个单细胞UMAP-24,270个单细胞UMAP-2UMAP-2肿瘤正常集群SIBAP1TP53BICD 1TBX4OTUD5PRDM5SENP2 3月6日PODXL2ADCY8NCDNCASP8ADARB2DLC1GIMAP6SUN1CDK13SLC8B1NDST4DCTSLC3A1TEKPELP1 CFAP61PRKAA1 SPTA1 IQGAP3 DLG 2PIN 4BCORL1C1SLTA4HGPR158IFIH1GMPPAGTF3C3RASGRP 4ADAMTS16ARID4AGAD 1PSMF 1RGS7SMYD1TLR4肿瘤正常肿瘤正常集群LRRC8C集群NPNP1脱氧核糖核酸1ABCC10TP53TECPR1KANK4DIDO1MED24KMT2EARFGAP 1RASAL2RIMS2NAT9C10orf12TP53PLEKHA6OSMUTRNMEFVSTXBP2PABPC5AP1m1ZBTB38SLC2A2CDs1SLC35F1基因基因基因会开放获取技术8Cell Genomics3,100215,2023KANK4TP53PLEKHA6脱氧核SLC35F1C10orf12UTRNSLC2A2RIMS2STXBP2MED24ATN1r = 0.793 p = 4.21e-16TN2r = 0.918 p = 1.09e-081.51.00.50.01.51.00.50.0TN33210TN443210r = 0.864 p = 1.54e-05r = 0.897 p = 1.83e-04Tn52.01.51.00.50.0r = 0.886 p = 2.21e-12方法外显子组单细胞B100TN1r = 0.816 p = 6.48e-07NAT9CDS1 MEFVZBTB38基因75PABPC5OSMAP1m1ABCC10250ARFGAP1NPHP1RASAL2KMT2EDIDO1TP53LRRC8C基因型纯合子杂
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功