没有合适的资源?快使用搜索试试~ 我知道了~
资源小鼠中通过高通量分析描绘的DNA甲基化动力学和失调图形摘要亮点dInfinium小鼠DNA甲基化微珠芯片的设计、注释和验证d1,239种不同细胞类型、品系、年龄和病理的d组织、印记、比较表观基因组学、菌株SNP和PDX肿瘤和年龄相关的DNA甲基化动力学和表观遗传时钟作者Wanding Zhou,Toshinori Hinoue,布雷特·巴恩斯,Brian H.放大图片作者:Chen,Hui Shen,Peter W. 莱尔德通信wanding.zhou@pennmedicine.upenn.edu(W.Z.),hui. vai.org(H.S.),peter.vai.org(P.W.L.)简言之Infinium阵列是用于人类样本的具有成本效益的高通量DNA甲基化分析工具。Zhou等人已经为小鼠开发了一种等效的阵列,并使用它来生成DNA甲基化图谱,该图谱代表了这种重要模式生物在发育、衰老和疾病中DNA甲基化生物学的多样性。Zhou等人,2022,细胞基因组学2,1001442022年7月13日,作者。https://doi.org/10.1016/j.xgen.2022.100144会会开放获取资源通过高通量描绘的DNA甲基化动力学和失调在鼠标中进行配置周万丁,1,2,* 日上敏,3布雷特巴恩斯,4欧文米切尔,3瓦利德伊克巴尔,1索尔MoE李,1凯利K。Foy,3Kwang-Ho Lee,3Ethan J. Moyer,1Alexandra VanderArk,5 Julie M。Koeman,6Wubin Ding,1ManpreetKalkat,3NathanJ. Spix,3BrynMelleson,7JohnAndrewPospisilik,3PiroskaE. Szabo',3MarisaS. Bartolomei,8岁妮可·A范德沙夫,3,10梁康,3阿什利K.Wiseman,3Peter A.琼斯,3康妮M。Krawczyk,5Marie Adams,6RishiPorecha,4Brian H.Chen,9Hui Shen,3,*和Peter W.Laird3,11,*1计算和基因组医学中心,费城儿童4Illumina,Inc.,生物信息学和仪器软件部,San Diego,CA 92122,USA5代谢和营养规划部,Van AndelInstitute,Grand Rapids,MI 49503,USA6基因组学核心,Van Andel Institute,Grand Rapids,MI 49503,USA7Vivarium and Transgenics Core,Van Andel Institute,Grand Rapids,MI 49503,USA8细胞和发育生物学系,表观遗传学研究所,宾夕法尼亚大学佩雷尔曼医学院,费城,PA 19104,美国9FOXO Technologies Inc.,Minneapolis,MN 55402,USA10现住址:Olivet Nazarene大学生物科学系,Bourbonnais,IL 60914,USA11引线触点* 通讯:wanding. pennmedicine.upenn.edu(W.Z.),hui. vai.org(H.S.),peter. vai.org(P.W.L.)https://doi.org/10.1016/j.xgen.2022.100144总结我们开发了一种小鼠DNA甲基化阵列,包含296,070个探针,代表了小鼠DNA甲基化生物学的多样性。我们提出了一个小鼠甲基化图谱作为1,239个DNA样本的丰富参考资源,包括不同的组织,品系,年龄,性别和病理。我们描述了比较表观基因组学,基因组印记,表观遗传抑制剂,患者来源的异种移植评估,回交追踪和表观遗传时钟的应用。我们剖析了与分化、衰老和肿瘤发生相关的DNA甲基化过程。值得注意的是,我们发现,组织特异性甲基化签名定位于控制相应组织发育的转录因子的结合位点。在Polycomb抑制区域,与甲基化相关的高甲基化是富集的,而低甲基化在被粘附素复合体结合的区域增强。ApcMin/+息肉相关的高甲基化影响调节肠分化的增强子,而低甲基化靶向AP-1结合位点。这种Infinium小鼠甲基化BeadChip(MM285版)可广泛用于研究社区,并将加速这种重要模式生物的高样本通量研究。介绍胞嘧啶-5DNA甲基化是高等真核生物中最常见的表观遗传标记,在脊椎动物中主要发生在序列背景50-CpG-30中。在哺乳动物中,DNA甲基化在巩固表观遗传状态、协调分化和发育以及抑制内源性转座因子的转录等方面发挥作用14-基于形成和阵列的方法在有效处理大量样品方面表现优异。全基因组亚硫酸氢盐测序(WGBS)是DNA甲基化深度全基因组表征的金标准。8然而,这一综合办法的成本和分析相当密集。减少代表亚硫酸氢盐测序(RRBS)9在样品通量和覆盖率之间提供了一个很好的折衷,最近已经扩展到覆盖更多的基因组。10单细胞WGBS提供异质样品的高分辨率DNA甲基化谱分析,但通常比深批量WGBS具有更低的基因组覆盖率。11-13Cell Genomics2,100144,July 13,2022?作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取资源2Cell Genomics2,100144,2022这些基于测序的方法提供了甲基化组的详细14对于大型的、基于人群的癌症基因组和表观基因组范围的关联研究,InfiniumBeadArrays15是经济高效、高通量DNA甲基化表征的首选平台。该技术使用一组预先设计的探针来同时询问数十万个CpG从样本量的角度来看,Infinium DNA甲基化阵列无疑主导了DNA甲基化分析,超过160,000份人类样本的Infinium甲基化数据保存在基因表达大全(GEO)(https://www.ncbi.nlm.nih.gov/geo/)中。包括《癌症基因组图谱》在内的大规模项目16涵盖了另外数万份未存放在地球观测组织的样本。这些研究在PubMed中共产生了1,200多个引用Infinium DNA甲基化阵列的检索结果InfiniumDNA甲基化阵列提供了几个明显的优势。首先,自动化样品处理允许在几天内并行分析数百个样品,产生高度可重复和可靠的结果。基于序列的协议标准化程度较低,并且具有更高的实验失败率。第二,阵列上的CpG因此,尽管询问的基因组CpG的比例相对较小,第三,每个CpG二核苷酸的b值输出代表样品中该位点的甲基化分子分数的高精度测量,这仅通过使用WGBS的非常深度测序实现。15,17第四,亚硫酸氢盐特异性杂交强调完全转化分子的评价,而基于测序的方法需要生物CpH甲基化和不完全亚硫酸氢盐转化之间的生物信息学区分。18第五,在所有样本中分析的相同的、注释良好的CpG的一致性有助于高度简化和有效的数据分析,这是一个经常被忽视的成本组成部分。第六,在所有阵列上的相同CpG集合的表征极大地促进和改进了交叉研究比较、验证和外推。第七,阵列数据的分析管道比WGBS更成熟和标准化。此外,杂交荧光数据可用于提取可通过WGBS获得的其他类型的基因组信息,例如拷贝数变异和遗传祖先。18,20-在人类DNA甲基化研究中,迄今为止还没有开发出靶向任何模式生物的等效商业阵列。已经有零星的尝试将人类铟阵列应用于灵长类动物2327定制的In finium阵列最近已经变得可用于靶向哺乳动物中的36,000个保守CpG。30小鼠对DNA甲基化微阵列的需求特别高长期以来,老鼠一直被用作一种特殊的由于其易于操作、繁殖迅速、遗传多样性以及灵长类动物和啮齿类动物之间的进化保守性,生物体是模拟人类生理和疾病的模型。事实上,小鼠是1962年首次报道胞嘧啶-5 DNA甲基化的脊椎动物物种之一。第一个真核细胞胞嘧啶-5 DNA甲基转移酶是从小鼠克隆的。[36]我们对DNA甲基化在哺乳动物中的作用的理解大多来自小鼠模型。3743因此,一种具有成本效益的、高样本通量的DNA甲基化阵列可以有效靶向小鼠基因组中最具生物学相关性的位点,这将为小鼠模型研究界提供一种急需的工具。在这里,我们提出了合理的系统设计和第一次实施的高效,市售的Infinium小鼠甲基化BeadChip(版本MM285),靶向小鼠基因组中的近300,000个CpG,我们证明了其高可靠性,重现性和实用性。我们分析了1,239个DNA样本,包括26种组织或细胞类型,作为研究社区的综合资源。我们还使用这个强大的工具解开了衰老和肿瘤相关的变化,并通过与衰老和肿瘤发生相关的DNA甲基化证明了不同类型的分化阻滞。最后,我们使用阵列内容构建并验证了小鼠的表观遗传时钟结果靶向生物学相关表观遗传特征的阵列设计我们以三个主要步骤设计小鼠甲基化珠芯片(图1A)。在第一步中,我们考虑了小鼠基因组中的所有基因组CpG,以及探针DNA链(Watson与Crick)和亚硫酸氢盐后转化链(转化与复制的子链)的所有可能组合。我们针对探针序列作图、遗传多态性影响、探针杂交和延伸效率筛选了潜在的探针设计(参见STAR方法)。在第二步中,我们选择了针对13个基因组特征和8组与已知生物学相关的基因组区域的CpGs。为了解释未知的生物学,我们纳入了28,011个随机CpG。接下来,我们通过平衡探针设计链、重复次数和Infinium探针化学,为每个包含的CpG选择最佳探针设计。我们还添加了几种类别的非CpG探针以在小鼠甲基化珠芯片上达到总共296,070个探针(图S1A)。探 针 选 择 涵 盖 绝 大 多 数 蛋 白 质 编 码 和 长 非 编 码 RNA(lncRNA)基因(图1B)。我们认为从转录物的转录起始位点(TSS)的任一方向的1,500 bp内的CpG我们无法为1,064个蛋白质编码基因设计合适的探针。这些基因被嗅觉受体、犁鼻受体、防御素和Prame基因家族过度表达,这些基因家族显示出高度的序列多态性,限制了探针设计。我们包括假基因和微小RNA(miRNA)TSS的探针,Cell Genomics2,100144,2022年7月13日3会开放获取资源(图例见下页)4Cell Genomics2,100144,2022会开放获取资源增强子和CTCF结合位点。我们涵盖了大多数非启动子CpG岛(CGI),并包括特定类别,如基因体CpG、异染色质CpG、转座元件、性染色体特异性CpG、印记控制区(ICR)、印记差异甲基化区(DMR)、其他单等位基因甲基化位点、与生殖细胞生物学、早期胚胎发育、癌症、衰老和表观遗传时钟相关的CpGs、亚稳态表观等位基因、人同步区和线粒体CpG,以及非CpG胞嘧啶甲基化探针(图S1A)。我们还添加了菌株特异性SNP探针,以促进菌株确认和回交追踪。不同设计类别的探针计数可参见图S1A,小鼠甲基化珠芯片的其他基本参数包括探针映射能力、亚硫酸氢盐转化链命名和探针冗余度(参见STAR方法),以及与图S1探头内置改进的探头ID系统,以适应探头设计中的新功能(参见STAR方法)。因为设计意图类别可以产生与多于一个这样的类别相关联的探针,所以我们还通过将每个探针映射到几个非重叠共有染色质状态之一来表征最终阵列内容(图1C)。我们从66个ENCODEchromHMM调用44导出共有染色质状态,并在代表每个染色质类别的阵列上绘制探针的丰度(图1C,饼图)。尽管静止染色质探针代表探针的大部分,但对整个基因组中每种染色质状态的CpG数目的标准化揭示,与其在整个基因组中的相对丰度相比,增强子和启动子在阵列上是最过度代表的,强调了阵列在表征基因转录控制中的效用(图1C[棒棒糖图]和S2B)。我们观察到不同组织中基因组中不同染色质状态的一致表示(图S2C)。探针分布在基因组的常染色质A和异染色质B区室中的整个基因组中,45分别松散地对应于高度甲基化的结构域和部分甲基化的结构域(PMD)8(图S2D)。在实验和实验室环境中具有高测量重现性我们分析了四个结肠肿瘤样品,代表四种不同的小鼠肿瘤模型,具有不同的DNA甲基化谱,8次重复检测,以评价Infinium小鼠甲基化MM285微珠芯片的技术重现性。我们采用两个单独的实验室来评估完整实验工作流程的再现性,包括亚硫酸氢盐转化,使用相同的96孔板布局,在不同的测定板和BeadChip位置上重复(图1D)。 我们已经在SeSAMe(版本1.11+)Infinium DNA甲基化数据处理工具中完全实现了MM 285版本的小鼠阵列的数据处理,20可在GitHub( https : //github. com/zwdzwd/sesame ) 和 Bioconductor(https://bioconductor.org/packages/release/bioc/html/sesame.html)。所有后续阵列分析均使用SeSAMe数据输出。对21,555个最多甲基化的CpG探针的无监督聚类显示了高度可重复的肿瘤特异性DNA甲基化谱 , 实 验 室 设 施 或 BeadChip 位 置 的 影 响 可 忽 略 不 计 ( 图S2E)。相同平板和微珠芯片位置的技术重复之间的实验室间Pearson相关系数为0.9924(n = 16对),而不同微珠芯片位置的技术重复之间的平均平板内相关系数为0.9945(n = 22对),相同微珠芯片位置的实验室内平板间相关系数为0.9981(n = 2对)。代表性重复实施例显示在图IE和IF中。减少输入DNA量和FFPE样本的可重现结果尽管Infinium小鼠甲基化微珠芯片的推荐输入DNA量为250-我们还获得了输入DNA 量低至5 ng的有噪声但可用的数据(图1H),这与Infinium BeadChip技术可应用于低至10 ng输入DNA的其他报道一致。46低输入DNA量导致较高百分比的探针测量被用于SeSAMe流水线所采用的信号-背景阈值化的pOOBAH方法掩蔽(图1G)。20正如从DNA甲基化的二进制性质所预期的,非常低的输入DNA量导致中间b值向b分布的极端崩溃,与来自较大DNA量的高质量数据相比,相关性降低(Pearson图1.小鼠DNA甲基化阵列设计及技术验证(A) 设计小鼠Infinium甲基化BeadChip的工作流程。(B) 与每个基因模型生物型相关的探针数量。(C) 不同染色质状态下探针的富集。使用来自12种组织的66个ENCODE ChromHMM文件的共有染色质状态。不同染色质状态中询问的CpG的分布显示在左下角。(D) 热图表示四个肠肿瘤样品的无监督聚类,每个样品以8倍重复进行分析,包括在两个单独的实验室设施。显示了21,643个最可变的探针(E和F)来自ApcMin(E)或Mlh1(F)肿瘤样本的两个重复样本的平滑散点图。颜色代表DNA甲基化b值,两次重复之间的b值差异显示在右上象限。(G) DNA输入量为5至1,000 ng的样品的探针成功率来自两个实验室的数据由不同的形状表示(H) 平滑散点图,对比低输入样本(5 ng)和高输入样本(500 ng)的比较,两者均具有1,000 ng输入样本。随着DNA输入的减少,样品(I) 比较新鲜冷冻样品和福尔马林固定24和48 h的样品的四种组织的DNA甲基化测量的重现性。另见图S1和S2;表S1。Cell Genomics2,100144,2022年7月13日5会开放获取资源我们研究了阵列对从福尔马林固定、石蜡包埋(FFPE)组织中提取的DNA样本的性能,我们使用FFPE修复试剂盒(见STAR方法)处理DNA样本。使用最多甲基化探针的无监督聚类揭示了对数据的微小样品处理影响的一些证据,但这些被生物学差异所掩盖(图11和S2F)。匹配的FF和FFPE样本之间的平均相关性为0.9875。使用甲基化DNA滴定和WGBS进行DNA甲基化测量的技术验证为了评估DNA甲基化测量的准确性,我们将未甲基化的DNA和M.SssI处理的完全甲基化的DNA组合(参见STAR方法),滴定至从0%至100%甲基化DNA的不同混合比(图2A)。每个样品的中位b值与甲基化DNA的滴定百分比很好地对应(图2B)。为了使用正交方法评估定量准确性,我们将小鼠B16黑素瘤细胞系DNA的阵列结果与相同DNA样品的WGBS进行了对于阵列上的绝大多数CpG,我们观察到两个测定平台之间的强相关性(Pearson总之,这些结果证实了小鼠甲基化阵列对于所询问的绝大多数CpG位点准确且可重复地测量甲基化分子的分数的生物学验证DNA甲基化测量使用DNMT1敲除和抑制剂我们使用基因靶向胚胎干细胞(ESC)评估了主要维持DNA甲基转移酶Dnmt 1水平降低对总体DNA甲基化分布的影响(图2D)。我们使用了一系列亚纯等位基因R,47P,H,48和N,38以及两个无效等位基因S,38和38。C. 49例杂合Dnmt 1敲除ESC未显示明显的DNA甲基化水平的降低,与杂合子中存在剩余的野生型等位基因一致,但是各种纯合和复合-杂合等位基因组合的中值甲基化为野生型品系的平均中值的20%至55%(图2D)。我们先前已经表明,Dnmt 1低形态等位基因的组合导致在肠肿瘤形成的ApcMin/+模型中肠肿瘤形成的抑制与Dnmt 1表达水平的降低相称。47在此,我们表明,在具有这些等位基因组合的小鼠的结肠粘膜中,总体DNA甲基化水平成比例地降低(图2E)。与野生型小鼠相比,Dnmt 1N/R小鼠不同组织的DNA甲基化水平野生型小鼠中甲基化程度最低的组织,如肌肉和胃,是Dnmt 1N/R小鼠中甲基化程度最低的组织之一(图S3A)。相比之下,睾丸是野生型小鼠中最高度甲基化的组织之一,并且除了最严重的低形态Dnmt 1N/R组合之外,它们还表现出对低甲基化的相对抗性(图2E和S3A)。研究在Dnmt 1+/+小鼠的所有组织中完全甲基化的6,022个CpG中,我们观察到这些区域在所分析的所有组织中对Dnmt 1N/R小鼠中的甲基化损失具有抗性(图S3B)。我们发现这6,022个CpG的转录区域比小鼠阵列的总含量高出4.4倍,这表明这些可能代表了广泛表达的基因,即使在Dnmt 1缺陷的条件下,这些基因也通过Dnmt 3b募集保留了基因体甲基化。Dnmt 1N/R小鼠其他区域的DNA低甲基化程度因染色质状态而异(图S3C),表明Dnmt 1突变诱导的低甲基化对基因组背景具有强烈的依赖性我们先前的分析已经鉴定出PMD区域的单一WCGW CpG对有丝分裂相关的甲基化丢失更敏感.与这些发现和Dnmt 1作为主要维持甲基转移酶的作用一致,在所有染色质状态和CpG类别中,单独-WCGW CpG在40年前,5-氮杂胞苷作为小鼠10 T1/2成纤维细胞DNA甲基化抑制剂的发现我们用5-氮杂-20-脱氧胞苷(地西他滨[DAC])重复该实验,并观察到显著的低甲基化,在第12天,DAC处理的细胞的中值b值达到模拟处理的DNA的中值b值的81%,到第24天,模拟处理的细胞的一些恢复达到86%(图2F),与先前的报道一致。五十三,五十四基因组元件甲基化生物学我们探索了代表26种不同细胞和组织类型的1,119个DNA样本中各种基因组元件的DNA甲基化的基因组分布。如预期的,我们观察到启动子区域的低DNA甲基化水平(图3A)。我们没有鉴定出在lncRNA启动子或miRNA启动子处的这种下降,这与大多数lncRNA和miRNA的相对受抑制的转录状态一致(图S4A)。跨探针的整合的基因组位置信息可以进一步杠杆化以检测空间DNA甲基化模式,例如与CTCF结合位点侧翼的核小体定相偶联的甲基化状态(图3A,最左边的小图)。从雌性小鼠中获得的样品在X连锁CGI处显示中等甲基化水平,与雌性中的X失活一致,但与雄性中的X失活不一致(图3B)。我们进行了多变量回归以鉴定性别相关的甲基化差异,并观察到与男性相比,女性中的甲基化水平通常更高,这归因于女性中的X连锁超甲基化(图3C)。值得注意的雌性相关低甲基化区域包括X连锁非编码RNA,如Firre和Xist,它们在失活X染色体上表达,并与其抑制状态的维持相关(图3C)。已知X染色体上的少数基因可以逃脱X失活。55我们鉴定了六个X连锁基因,这些基因被预测在阵列上具有足够的探针覆盖率的情况下会逃脱X失活。我们发现,在女性结肠样品中覆盖这些基因的探针的甲基化行为与男性结肠样品的甲基化行为相似,与逃避X-失活一致,并且与大多数其他X-连锁基因的甲基化行为不同(图S3E)。6Cell Genomics2,100144,2022会开放获取资源图2.DNA甲基化测量的生物学验证(A) 来自两个不同实验室的滴定样品的DNA甲基化b值分布(B) 由Infinium小鼠甲基化MM285微珠芯片(y轴)测量的中位DNA甲基化b值与甲基化DNA的滴定分数(x轴)的比较。两个不同的实验室以不同的颜色显示。(C) 从MM285阵列测量的DNA甲基化b值(y轴)与小鼠B16黑素瘤细胞系上的WGBS甲基化水平测量(45 X平均CpG覆盖度)(x轴)的比较(D) 不同Dnmt 1基因型的J1胚胎干细胞甲基化水平分布(E) Dnmt 1亚型小鼠结肠和睾丸DNA甲基化水平分布(F) 用200 nM地西他滨(DAC)处理或用PBS溶剂模拟处理24小时,然后在处理后12天和24天取样的10 T12细胞的甲基化水平分布。另见图S3和表S2。Cell Genomics2,100144,2022年7月13日7会开放获取资源图3.基因组元件甲基化生物学(A) DNA甲基化水平的基因组分布集中在CTCF结合位点和蛋白质编码基因(常染色体和X连锁)。相应地显示了每bp的CpG密度(顶行)、每bp的设计探针密度(中间行)和按组织类型分层的样品的平均甲基化水平(底行)(B) 来自雄性和雌性小鼠的结肠样品和来自雄性小鼠的睾丸样品中X-连锁CpG岛CpG的甲基化水平分布(C) X连锁CpG的基因组分布(上)、小鼠MM 285探针密度(中)和性别特异性甲基化差异(由多元回归中性别特异性效应的斜率表示(D) 热图显示了与非恶性和肠肿瘤组织样品(列)中的13个策划的印迹控制区(ICR)相关的CpG(行)的甲基化水平CpG通过基因组坐标排序相关的ICR区域标记在右侧。顶部的灰度水平条表示Dnmt 1基因型和恶性状态。第二个条表示组织类型,使用热图左侧上方指示的颜色键第三个条代表小鼠年龄,颜色键显示在右侧。(E) 与ICR或二级差异甲基化区域相关的CpG的DNA甲基化水平分布。显示了来自两种性别和Dnmt 1(F) 128例结肠和小肠组织样本中13个ICR处CpG DNA甲基化水平与年龄的相关性。(G) 不同性别和Dnmt 1基因型结肠和睾丸线粒体CpG甲基化分布(H) 显示CpH甲基化水平的热图在CpA、CpC和CpT背景下,cytosine对应于胞嘧啶基因座列对应于ESC和不同的组织样品。另见图S4;表S3和S4。8Cell Genomics2,100144,2022会开放获取资源(图例见下页)Cell Genomics2,100144,2022年7月13日9会开放获取资源我们证实,印迹区域中ICR和DMR处的CpG显示出中等甲基化水平,与其单等位基因甲基化状态一致(图3D)。在雄性生殖细胞中,基因组印记被擦除,父系印记模式被建立,在某些情况下作为甲基化位点,或更常见地作为每个单独基因座的未甲基化状态,导致睾丸中大多数印记基因座的DNA甲基化水平极化(图3D和3E,右)。我们详细分析了小鼠体细胞组织样品中的H19-Igf 2ICR和二级DMR,并验证了相应CpG的中间DNA甲基化(图S4B)。我们对探针与先前报道的小鼠ICR的关联进行了全面的注释(参见关键资源表)。我们还使用先前生成的精子和卵母细胞的WGBS数据,基于体细胞和睾丸中的DNA甲基化水平,对潜在的单等位基因甲基化和来源亲本相关的差异甲基化进行了从头注释(参见STAR方法和图S4C)。151个在体细胞组织中严格中等甲基化的CpG落在13个先前报道的ICR中(图S4C)(参见STAR方法获得这些探针注释)。与13种策划的ICR相关的大多数CpG显示一致的中间甲基化水平(图3D)。然而,这些CpG的一个子集揭示了组织特异性或肿瘤相关的中间甲基化(LOIM)模式的丢失(框出)。值得注意的是,胎盘组织在多个ICR的CpG亚组中显示LOIM。一个Rasgrf1相关的CpG(cg47072751_BC21)仅在造血细胞中显示甲基化增加,如在分选的血细胞和主要由血细胞组成的脾组织中所见。MestICR中的一个CpG显示以后脑特异性方式获得甲基化。有趣的是,我们在胃肠道组织中的多个ICR中鉴定了CpG处的协调LOIM,主要代表甲基化的增加我们发现这种甲基化增加与年龄呈正相关(图3F和S4D)。在肠肿瘤中,我们观察到ImpactICR的局部低甲基化,而Rasgrf 1显示局部高甲基化(图3D,右)。在具有亚纯型Dnmt 1等位基因的结肠组织中,与其他基因组区域(图2E,左)相比,印迹我们观察到在具有更严重的整体低甲基化的Dnmt 1基因靶向ESC中印迹区域对低甲基化的不同易感性(图S4E)。在印迹区域中,Rasgrf1对低甲基化的抗性最强,其次是Peg13和H19。其他印迹基因座似乎更容易在Dnmt1亚型ESC中丢失甲基化。我们在小鼠阵列设计中掺入了针对文献中描述的Meta稳定等位基因和非甲基化区域(VMR)的探针。56然而,我们观察到VMR探针富集显示组织、菌株和性别相关差异甲基化的CpG(图S4F)。因此,如果我们将我们的分析限制在固定的细胞类型、菌株和年龄内,那么研究这些CpG是否表现出更多可变的甲基化是很我们分析了相同年龄和品系的流式分选的B细胞样品中VMR探针处的甲基化变异性,并且确实观察到个体小鼠之间甲基化水平的显著更高的方差(图S4G,左图)。然而,我们还注意到,VMR探针具有更多的中间平均b值(图S4G,右图),允许b分布尺度上的更高方差60我们没有观察到VMR和非VMR探针之间方差的显著差异,平均b值限制在0.5和0.7之间,表明中间甲基化值是VMR处可变甲基化的主要决定因素。正如预期的那样,线粒体CpG似乎大多未甲基化,这是由于缺乏进入核DNA甲基转移酶的途径(图3G)。我们使用阵列设计中包含的2,310个CpH探针评估了来自不同组织的798个样本中的非CpG(CpH)甲基化。大多数组织显示非常低水平的CpH甲基化(图3H),与文献一致。我们在成年小鼠的后脑和额叶脑样品中鉴定出中等水平的CpH甲基化,特别是CpA甲基化(图3H)。这种CpH甲基化在胎儿脑样品中不存在,这与出生后发育期间CpH甲基化的建立一致,而CpG甲基化在早期发育期间建立。61组织特异性DNA甲基化模式和特征的鉴定我们通过将1,076个样品中的每一个投影到二维空间,使用应用于阵列上的所有甲基化探针的t分布随机近邻嵌入(t-SNE)来探索影响小鼠甲基化组变化的主导因素(图4A)。通过不同的元标记对样品进行着色,揭示了DNA甲基化组由不同因素驱动的程度。样品聚类由组织类型主导(图4A,左)。我们进一步使用DBSCAN对这些DNA甲基化组进行聚类,并使用聚类成员和样本元信息计算不确定系数。与t-SNE分析一致,组织类型是主要的图4.组织特异性DNA甲基化模式和特征的鉴定(A) t-SNE聚类图显示按组织类型(左)和性别(右)聚类的样本。颜色图例与图3A中的颜色图例相同。(B) 四向维恩图显示了467个小鼠样品中CpG在品系、组织、性别和年龄方面的差异甲基化。(C) 在每个组织中特异性甲基化(顶部)和未甲基化(底部)的CpG(行)(列显示按组织类型组织的样品)。(D) 在每种分选的白细胞类型中特异性甲基化(顶部)和未甲基化(底部)的CpG(行)(列显示按细胞类型组织的样品)。(E) 跟踪查看Mir200c基因座的DNA甲基化谱作为上皮细胞与间充质细胞的标志物与Mir200c基因座相关的五个CpG的组织类型和平均甲基化水平(由底部的红色条显示)显示在热图的右侧。(F) 使用组织特异性低甲基化(左)和高甲基化标记(右)的野生型和Dnmt 1NR小鼠原代组织样品的t-SNE聚类图。颜色图例与图3A中的颜色图例相同。参见图S5。10Cell Genomics2,100144,2022会开放获取资源DNA甲基化组确定的因素,随后是年龄、品系和性别(图4A[右]、S5A和S5 B)。代表22种主要组织类型的246个样品的分层聚类显示主要通过组织类型分组(图S5C),验证了组织类型在甲基化组测定中的重要性。然后,我们对467个非肿瘤样本的组织、品系、性别和年龄进行了CpG甲基化的全阵列多变量回归分析(图4B)。显示与每个变量相关的显著DNA甲基化差异的CpG数量及其相互作用显示在维恩图中。与我们的无监督分析一致,组织类型和年龄是特定甲基化行为的最强个体驱动因素。许多CpG显示来自多个协变量对甲基化水平的联合影响。例如,95%的组织特异性CpG的甲基化受到其他因素的联合影响,包括菌株(图4B)。鉴于阵列上许多CpG处甲基化水平的组织特异性和各种实验设置中基于甲基化的组织解卷积的值,我们试图鉴定一组在特定组织中差异甲基化的探针(图4C)。图4C表示与其余组织相比,在每个组织(列)中特异性高甲基化或低甲基化的探针(行)。一些在相关组织类型之间共享的甲基化特征(例如,来自胃肠道的组织)。某些组织类型与比其他组织更丰富的组织特异性甲基化相关脂肪、肾、肺)。这些组织特异性甲基化特征与控制相应组织发育的转录因子的结合相关(图4C、S5D和S5E)。与高甲基化相比,观察到更多的与组织特异性低甲基化相关的CpG,这种对甲基化或非甲基化DNA的偏好导致组织特异性转录因子被分为两类。例如,淋巴细胞特异性低甲基化与Tcf 7、Ets 1、Ikzf 1和Foxp 3相关,而淋巴细胞特异性高甲基化与Cebpa/b/g、Tal 1和Gata 1相关。有趣的是,Cebpa/b/g与淋巴细胞特异性高甲基化相关,但另一方面,与髓细胞特异性低甲基化相关,揭示了转录因子-DNA相互作用的复杂模式。我们使用荧光激活细胞分选的白细胞来进一步区分B细胞、CD4 T细胞、CD8 T细胞和单核细胞(图4D)。这些甲基化特征可用于研究混合组织/细胞类型情况中细胞类型的存在或不存在。Mir200c基因座的甲基化是人间充质细胞的已知特征。64,65我们评估了位于Mir200c基因的基因组附近的CpG,并鉴定了5个CpG,其甲基化可以可靠地区分间充质细胞和上皮细胞。主要由上皮细胞组成的组织如结肠和小肠大部分是未甲基化的,而主要由间充质细胞组成的组织如白细胞大部分在该位点甲基化(图4E).使用这些探针,我们可以推导出上皮肿瘤的组织纯度的基于DNA甲基化的估计值,我们在图7所示的肿瘤研究中使用了该估计值。由于这些组织特异性甲基化差异可用于标记组织/细胞身份,我们接下来研究了通过Dnmt 1亚纯型等位基因改变甲基化组在多大程度上会影响这些位点的甲基化以及潜在的细胞身份。尽管Dnmt 1缺陷确实会引起这些组织相关的低甲基化和高甲基化信号的一些扰动,但样本在t-SNE中仍主要按组织类型分组(图4F)。有序热图中的目视检查揭示了这些特征的组织特异性被很好地保留(图S5F),与观察到的组织解剖学和组织学的保留一致。种属间比较和对患者源性异种移植物的应用我们探索了其他哺乳动物物种的这种阵列的效用我们将阵列探针映射到Ensembl(版本101)中图5A描述了我们的阵列中来自56个物种的可定位探针的数量,并与人Infinium DNA甲基化EPIC阵列一致。正如预期的那样,功能探针的数量随着进化距离的增加而减少。预计Infinium小鼠甲基化珠芯片在小鼠中发挥最佳作用,但也应适用于相关物种,如阿尔及利亚小鼠、琉球小鼠和Shrew小鼠。我们实验研究了小鼠阵列在人类样本以及其他啮齿动物中的性能我们评估了人、大鼠、小鼠和仓鼠(CHO细胞系)DNA的性能。每个探针类别中观察到的信号强度与预测的探针注释一致(图S6A)。使用13,962个对大鼠基因组具有高映射质量的探针,我们通过实验验证了这些探针忠实地代表了大鼠DNA中不同的甲基化水平,使用以不同比例滴定的完全甲基化和未甲基化的大鼠DNA的混合物(图5B)。为了研究人和小鼠阵列的交叉应用,我们鉴定了预测对人(EPIC)和小鼠(MM285)阵列上的两种物种都有效的探针组,以及预测仅对设计的物种有效的探针。我们使用在人(EPIC)和小鼠甲基化阵列上分析的不同比例的人和小鼠DNA的混合物实验性地测试了这些(图5C)。正如预期的那样,当小鼠与人DNA的比率变化时,预测对两个物种都有效的探针组保持高探针成功率相比之下,为一个物种设计的探针显示出探针成功率随着其他物种的DNA的分数增加而降低由于Infinium平台可以容纳低输入DNA量(图1H),因此来自另一种物种的非杂交DNA的存在不会成为问题,直到大量过量的非杂交DNA的存在。其他物种也达到了。研究DNA甲基化的进化保守性需要适当控制其他生物协变量,如组织。为了研究甲基化模式的保守性并研究组织类型如何影响这种保守性,我们首先使用靶向与EPIC CpG共线性的CpG的探针进行主成分分析(图5D)。如预期的,设计用于映射到EPICCpG 的 CpG 比 其 他 核 DNA CpG 类 别 在 进 化 上 更 保 守 ( 图S6B)。第一主成分(PC1)是强Cell Genomics2,100144,2022年7月13日11会开放获取资源图5.种属间比较和对患者源性异种移植物的应用(A) 不同脊椎动物和无脊椎动物物种上功能性EPIC和MM285阵列探针的数量。(B) 大鼠基因组中功能探针的DNA甲基化读数分布。使用0%至100%的滴定比,通过混合完全甲基化和完全未甲基化的大鼠DNA获得大鼠DNA样品。(C) 小鼠(左)和EPIC阵列(右)在以小鼠DNA的百分比范围滴定的人-小鼠混合物上的探针成功率(x轴)。不同颜色的曲线表示对两种物种(黄色)或仅对设计物种起作用的探针组。(D) 主成分分析显示x轴上的主要PC(PC 1)和y轴上的组合PC 2 -10。样品由具有代表物种的符号形状的组织着色。(E和F)物种特异性探针(E)和组织特异性探针(F)的DNA甲基化水平的热图显示。(G)使用人-小鼠变体探针(x轴)和使用来自小鼠和EPIC阵列的人-小鼠非同线探针估计人DNA分数的交叉验证。每个三角形代表人-小鼠滴定样品。每个圆圈代表PDX样品。三角形的颜色对应于人DNA的已知滴定分数。另见图S6;表S5和S6。与物种特异性效应相关(图S6C),占同线CpG甲基化变异的34%。人和小鼠组织在同线CpG甲基化组中的成对相关性揭示了不同程度的组织对应性:小鼠食管、胃、心脏、脾和睾丸与人相应组织的相关性最好(图S6D)。相比之下,小鼠的大脑、肝脏和结肠与它们的人类对应物没有很好的相关性。我们接下来回归了组织和物种上的人-小鼠同系CpG的甲基化水平。我们在回归分析中鉴定了组织和物种效应的广泛相互作用,仅留下149个共线CpG显示物种特异性甲基化但无组织特异性甲基化(图5E和S6E),并且仅255个CpG仅显示组织特异性甲基化(图5F和S6E)。Infinium-I探针的颜色通道由探针的延伸碱基的身份决定18完美映射到人类基因组的探针的子集可以与由于在探针延伸碱基处人类和小鼠之间的单核苷酸变异(SNV)而这些探针在与人DNA杂交时在一个颜色通道中发射信号,而在与小鼠DNA杂交时在另一个颜色通道中发射信号我们在小鼠MM 285阵列上鉴定了19个这样的人-小鼠变体探针使用这些探针,我们可以测量人-小鼠混合物样品(如患者来源的异种移植物(PDX))中人类DNA的分数。我们可以将该方法与物种特异性非同线探针的总荧光信号强度进行比较。这两种方法之间的比较显示在图5G中,用于以已知的不同比例滴定的人和小鼠DNA的混合DNA样品,12Cell Genomics2,100144,2022会开放获取资源在小鼠和人(EPIC)DNA甲基化阵列上分析(图5G和S6两种方法对人DNA含量
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功