没有合适的资源?快使用搜索试试~ 我知道了~
文章使用改良的大规模平行报告基因测定法对RE1沉默子的全基因组功能表征图形摘要亮点d高通量报告基因测定(MPRAduo)测量两种CRE顺式相互作用d使用MPRAduo的RE 1沉默子的全基因组表征d确定了沉默子功能d确定了1,500种与调节RE1活性作者作者:Kousuke Kongi,Hannah B.Dewey,Rodrigo Castro,DanielBerenzy,Susan Kales,RyanTewhey通信kousuke. jax.org(K.M.),ryan.jax.org(R.T.)简言之与激活因子相比,转录沉默因子的研究还不够深入. 通过使用MPRAduo,等人进行RE1沉默子的全基因组他们还确定了影响RE1活性的人类遗传变异。Alzhei等人,2023,细胞基因组学3,1002342023年1月11日- 2022年作者https://doi.org/10.1016/j.xgen.2022.100234会会开放获取文章使用改良的大规模平行报告基因测定法对RE1沉默子的全基因组功能表征Kousuke Kongi,1,4,*Hannah B.杜威,1罗德里戈·卡斯特罗,1丹尼尔·贝伦齐,1苏珊·卡莱斯,1和瑞安·特维1,2,3,*1The Jackson Laboratory,Bar Harbor,ME 04609,USA2缅因大学生物医学科学与工程研究生院,美国缅因州奥罗诺3塔夫茨大学医学院生物医学科学研究生院,美国马萨诸塞州波士顿4主要联系人*通 信 : kousuke.jax.org ( K.M. ) , ryan.jax.org ( R.T. )https://doi.org/10.1016/j.xgen.2022.100234总结顺式调控元件的上调和下调都有助于调节精确的基因表达。然而,我们对压抑因素的理解远比激活因素有限为了解决这一差距,我们的特点是RE1,一组转录沉默REST结合,在全基因组范围内使用修改的大规模并行报告分析(MPRAduo)。MPRAduo经验性地定义了REST的最小我们确定了1,500种改变RE 1沉默的人类变异,并发现当它们与m值以上的REST结合位点重叠时,它们的效应大小是可预测的此外,我们表明,非典型的REST结合基序表现出沉默功能,只有当他们精确地对齐半位点与特定的间隔区长度。我们的研究结果显示了对RE1的机制见解,这使我们能够预测其活性和变体对RE1的影响,为转录因子结合位点的全基因组功能表征提供了一个范例介绍顺式调控元件(cis-regulatory elements,CREs)诱导和抑制转录对于控制细胞身份和功能的时空响应至关重要。1在发现作用于乳糖操纵子的抑制性元件2半个多世纪后,表征CREs的方法的快速发展揭示了多层表观遗传景观,突出了负责多细胞控制和环境响应的基因调控的动态网络。3,4组蛋白修饰和染色质可及性的详细图谱使我们能够注释人类基因组中超过800,000个调节基因表达的候选元件,重点关注激活或促进转录的元件(即,增强子和启动子)。5这种偏差是由生物学和技术因素驱动的,部分原因是我们对区分活性增强子的染色质标记的了解,这导致了对压制性元素的大规模功能研究减少(即,沉默子),并且因此,对阻遏物元件在整个基因组中发挥作用6,7因此,增加对抑制性元件的关注对于理解完整的基因调控景观至关重要。8-10尽管大多数阻遏元件的特征性仍然很差,但阻遏元件1/神经元限制性沉默元件(RE1/NRSE)是一组定义明确的消音器。11,12RE1与RE1沉默转录因子(REST)结合,REST也称为NRSE因子(NRSF),其是通过脊索动物保守的锌指转录虽然RE1最初被发现是非神经元细胞中神经元特异性基因的沉默者,但REST也被发现在大脑和非神经元基因的抑制中起着关键作用。REST将组蛋白脱乙酰酶(HDAC)复合物和组蛋白甲基转移酶EHMT 2/G9 A募集至RE 1用于沉默,1717,2023我们对TF在RE1处相互作用的了解有助于理解沉默机制,但需要对RE1活性进行系统测量,这一点尚未完成。大规模平行报告基因测定(MPRA)是一种高通量功能性基因组平台,其被设计用于直接测量数百万个CREs的活性,并且可以鉴定调节其调节活性的遗传变体。24-27,28几个例子已经证明,在MPRACellGenomics 3,100234,January 11,2023?2022作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取文章2Cell Genomics3,100234,2023A BC D EF图1. MPRAduo基准测试(A) MPRAduo的工作流程寡核苷酸被合成、条形码化并克隆为具有GFP ORF和最小启动子(minP)的单个文库然后,扩增寡核苷酸将文库转染到培养的细胞系中,然后分离GFP mRNA并测序。mRNA读数的聚集计数通过质粒DNA计数标准化。(B) MPRAduo基准库的内容。在GM12878的MPRA中,E元件按其活性的升序命名:En01具有最低表达,而En21具有最高表达。(C) duo文库之间的标准化表达水平(mRNA/质粒DNA比率的log2)的相关性。r表示Pearson(D) 单文库的对数加性模型与SE文库中观察到的duo值之间的相关性。(E) 各类候选消音器的MPRA活性红线表示阴性对照的中位数(图例接下页)Cell Genomics3,100234,2023年1月11日3文章会开放获取有助于检测阻遏元件,并且当使用单一启动子类型通过MPRA测试时,不归因于经典官能团的CREs的显著部分(41%)充当9,28,29还表明,CRE之间的相互作用可以根据包括所涉及的细胞类型和TF在内的背景表现出特异性,这强调了当研究阻遏物功能时,CRE用于报告测定中的基础表达的重要性。因此,为了了解其基本机制和对疾病的影响,在报告基因测定中大规模测试抑制元件,对转录激活CREs进行系统评价和适当选择是必不可少的。为了实现这一点,我们试图使用MPRA来表征CREs之间的相互作用,以检测大规模的沉默子活性。结果MPRAduo为了优化MPRA通过将沉默子与适当的CRE配对来表征沉默子活性的能力,我们开发了MPRAduo,其测试位于相同报告载体上顺式的两个CRE(图1A和S1A)。为了将测试元件与转录的mRNA相关联,我们将10个和20个核苷酸的条形码添加到激活CRE(E)和沉默子中。(S)模块,然后使用独特的接头序列(pD GFP)将它们克隆到两个标准MPRA质粒载体中。与标准MPRA文库一样,我们在测试序列和条形码之间插入了具有最小启动子的GFP开放阅读框(ORF)(我们将单个文库标记为E和S)。然后,我们扩增寡核苷酸(oligo)-GFP-条形码盒并将其克隆到互补pDGFP文库中,从而产生用于两种比对的组合的E和S文库,这使得我们能够测试CREs的相对位置的影响(duo文库:SE和ES,根据最小启动子上游50至30的两个元件的比对在将文库转染到培养的细胞中之后,我们分离GFP mRNA并对30个UTR中的两个条形码进行测序以回收元件及其取向用于下游分析以定量表达水平(STAR方法)。MPRAduo基准测试我们使用MPRAduo来鉴定当与假定的消音器组合测试时响应于抑制效果的CRE。我们选择了19个激活CREs,长度为150-bp,先前通过MPRA测试用于在文库E(E元件)中进行评估。选择27个E元件以代表一系列活性水平和TF结合。此外,对于总共21个独特序列,包括2个无报告基因活性的阴性对照(STAR方法)。对于文库S,我们使用TF染色质免疫沉淀测序(ChIP-seq)峰,其包括针对ChIP靶标的结合基序,以从REST、CTCF(源自拓扑关联结构域边界或由H3 K27 ac标记的增强子样基因座)和YY 1中选择509个候选沉默子元件。对于GFI 1,我们根据以下因素选择了292个研究中心:由于在我们的靶细胞类型中缺乏ChIP-seq数据而存在结合基序。我们还包括鸡HS4序列,这是一个众所周知的增强子阻断剂(EB),和5个人CTCF结合位点,从以前验证的EB。32,33除了沉默子候选物之外,我们还包括在标准MPRAs27中具有活性的74个对照和从基因组中随机选择的806个匹配的背景对照序列文库E和S被构建为单个文库并且在两个方向上一起构建,产生文库ES和SE,其总共含有72,562个独特构建体。我们创建了两个含有单文库和一个双文库的库通过将每个文库的阴性对照的模态活性转换为零(STAR方法),在库内和库之间对文库进行标准化。在单个文库中具有活化作用的元件(E和S)显示两个库之间的高度相关性,表明该系统在实验中具有高度可重复性(对于CREs,r= 0.77;对于活性对照,r = 0.65;图S1B和S1 C)。当使用单文库活性测量的对数加和模型(R2= 0.79和0.68)时,双文库(ES和SE)显示出在取向之间(r =0.77)以及与单文库相似的一致性(图1C、1D和S1D),这与先前通过MPRA测试时元件如何相互作用的观察结果一致三十一,三十四MPRAduo显示CTCF和RE 1的显著抑制(图1E;表S5)。在ES文库中的4个E元件和在SE文库中的9个E元件的基础表达水平显著地抑制了在ES边界处的CTCF结合位点(图S2A)。RE 1在MPRAduo中显示出最显著的阻遏,ES文库中有15个E元件,SE文库中有13个E元件(图1F和S2B)。总的来说,RE1在两个比对中抑制了12个E元件的活性,抑制强度与E元件的基础水平表达相关,尽管少数E元件,特别是En11和En15,尽管它们具有中等至强的基础活性,但对RE1无反应。这些结果表明,MPRAduo可以检测RE1和CTCF结合位点的抑制,并鉴定在报告基因测定中提高沉默子信噪比的CREs。全基因组RE1筛选受到MPRAduo表征RE1抑制的能力的鼓舞,我们试图全面了解基因组范围内RE1活性的机制。我们在四种人类细胞类型中的至少一种中选择了8,436个含有典型REST结合基序并与RESTChIP-seq峰重叠的RE 1位点:GM 12878、K562、HepG 2和SK-N-SH(图2A)。我们还包括4,430个基因组序列,这些序列与四种细胞类型中的一种或所有细胞类型中的REST ChIP-seq峰重叠,但不包含典型的REST结合基序。为了避免评估启动子,这可能会增加报告基因测定中的表达,我们排除了转录起始位点上游5-kb内的所有基因座。合成在其中心(从第91至第111个核苷酸)含有REST结合基序的长度为200 bp的基因组序列,并在ES(F) ES文库中RE 1和E元件的组合的活性通过RE 1和背景对照的相应组合的分布标准化。与使用Benjamini-Hochberg程序(BH)校正的背景对照相比,通过Mann-Whitney U检验(U检验),* 调整p [adjp] 0.05,** adjp 0.01,*adjp 0.001。4Cell Genomics3,100234,2023会开放获取文章图2. 全基因组RE1筛选(A) 全基因组RE1文库的内容将来自具有或不具有典型REST结合基序的4种细胞类型的ChIP-seq峰与5种增强子组合。增强子的名称对应于图1所示的基准测试集。所示的基序来自JASPAR(MA0138.2)。(B) 在至少一种细胞/增强子组合中显示具有1%假发现率(FDR)的阻遏的RE 1的比例。(C) (B)中所示的强沉默子中表观遗传标记富集的Log2(比值比)。**adjp 0.01,*adjp 0.001,通过使用BH校正的Fisher(D) REST的预测结合评分和基序贡献(log2(乱序/天然))与K562中En 19之间的相关性。紫色线表示线性回归,橙色线表示分段线性回归。虚线表示由分段线性回归确定的变化点(E) 对于每种细胞类型,具有En19的MPRAduo活性基因组REST ChIP+表示在每种细胞类型中被REST结合的RE 1,基因组RESTChIP-表示在观察细胞类型中不被REST结合但在其他细胞类型中结合的灰色线表示阴性对照的中位数* 调整0.05,**adjp 0.01,*adjp 0.001,通过U检验与使用BH校正的阴性对照相比库以及从基准测试集中测试的5个E元素。我们选择E元件以覆盖基于我们的基准测试结果的一系列活性水平,包括一个阴性对照(En02)、一个RE 1非响应性CRE(En11)和3个表现出RE 1显著抑制的CRE(En09、En19和En21)。我们确认了所有四个CREs都在活动H3K27ac在我们的筛选中使用的四种细胞类型中的存在。35我们在GM 12878、HepG 2、K562和SK-N-SH细胞中测试了全基因组RE 1 ES文库,这些细胞作为一个整体代表了三个胚层(图S3)。使用t-随机近邻嵌入(t-SNE)评估细胞类型Cell Genomics3,100234,2023年1月11日5文章会开放获取通过比较基因组特异性和E元件特异性,我们观察到了RE1的沉默活性,其中每个E元件的典型REST基序在细胞类型中聚集在一起,这表明,通常,MPRAduo内的REST活性比细胞类型更依赖于基因组背景(图S3C)。总共有2,657个具有典型基序的REST结合位点(31%)和486个不具有典型基序的REST结合位点(10%)在至少一种细胞类型中以1%的错误发现率(FDR)显示出强烈的抑制,并具有一个E元件(图2B)。在用MPRAduo测试的所有四种细胞类型的天然基因组背景中,这3,143个序列耗尽了增强子(H3K27ac和H3K4me1)的表观遗传标记(图2C)。我们在四种细胞类型中没有观察到Polycomb的标记物H3K27me3的为了测量21-bp REST结合基序对每个200-bp RE 1序列抑制的精确贡献,我们通过扰乱基序去除了5,866个RE 1序列的REST基序。通过取乱序序列和天然序列之间的表达差异(基序贡献)并将其与通过FIMO36评分的天然序列的预测结合评分进行比较来计算每个REST基序的效应评分(图2D)。虽然弱REST基序对阻遏没有贡献,但当与GM12878中除了En02和En11之外的所有E元件配对时,较强的基序显示出明显的贡献,这两个元件在试验结果中不响应RE1。然而,当与其他三种细胞类型中的两个E元件结合时,强基序有助于RE 1的抑制,表明两个E元件对RE 1的无反应性是细胞类型特异性的。为了确定弱基序和强基序之间的边界,我们使用具有变点估计的分段线性回归来建模结合得分和抑制活性之间的相关性。相关性明显偏移的20个E元件-细胞组合中的18个的平均变化点为20.86(范围为19.0 - 21.9),高于该平均变化点,回归斜率显著增加(图S4;表S10);我们使用该平均变化点作为边界来描绘弱和强REST结合基序。变化点的估计值彼此接近(SD =0.805),表明变化点与细胞类型无关。将视野扩大到整体在200 bp的沉默子元件中,具有强基序并在测试细胞中被REST结合(特异性ON)的RE 1序列显示出显著的抑制,而具有弱基序的元件则没有,并且甚至显示出一些序列的表达的强烈增加(图2E和S6)。这些结果证明了REST结合基序得分的边界(REST基序内在值[m-value]),其决定了MPRAduo中的RE 1沉默子功能。非规范结合基序需要精确布置和间距的一半我们接下来集中于探索10%的没有典型基序的REST结合位点,其显示出被MPRAduo抑制。REST的典型21-bp结合基序由间隔2bp先前的工作已经表明,在REST ChIP-seq峰37、38中发现了含有具有不同组合、取向和间隔子长度的典型基序的两个半位点的非典型基序(图3A)。但据不清楚这些半位置的布置如何影响消音器活性。为了评估这一点,我们在4,430个REST结合位点中鉴定了没有典型基序的半位点,并注释了具有高于由典型基序确定的REST m值的总结合得分的非典型半位点对。我们的文库包括204个序列,其中包含一个重复间隔的基序和57个翻转,52个收敛,54个发散基序以及509个序列与一个单一的半位点。非典型间隔的基序是在MPRAduo中显示显著抑制的唯一构型(图3B和S6A)。接下来,我们比较了MPRAduo中不同间隔区长度的空间间隔基序的抑制,发现具有8-和9-bp间隔区的序列抑制表达,而其他距离显示无抑制作用,这与REST ChIP-seq信号中观察到的结果一致(图3C、3D和S6B)。在具有En 19的所有细胞类型中以及在具有其它E元件的一些细胞类型中显示具有8-或9-bp缺口的显著阻遏(图S7)。为了进一步评估REST结合基序的间隔区要求,我们进行了额外的MPRA,其中我们修饰了8-或9-bp间隔基序的缺口序列,并在K562细胞中对其进行了测试。当8-或9-bp缺口序列被打乱时,表达水平显著增加,表明在介导沉默活性的8-或9-bp缺口序列内存在核苷酸限制(图3E)。然而,我们无法在与沉默相关的缺口序列中恢复不同的基序(参见STAR方法)。此外,将缺口序列改变为来源于典型基序的2bp进一步降低了表达水平,证实了8-或9-bp接头足以沉默,但弱于典型的2-bp缺口序列。这些结果提供了直接的功能支持,即非典型REST结合基序需要精确对齐两个半位点,具有8或9 bp的特异性间隔区长度的抑制活性。一组TF与REST共定位以促进消音器功能为了对RE1的其他辅因子进行分类,我们试图找到除了REST之外可能在RE1上运行的TF。使用TF ChIP-seq数据,我们在K562细胞中鉴定了共定位于具有典型REST基序的RE 1序列处的329个TF;我们选择K562是因为它在MPRAduo中具有最低的实验噪声和最大丰度的ChIP-seq数据。对于每个TF,我们基于如通过ChIP-seq确定的TF和REST的结合将RE 1序列分成四组( 例如,TF +/REST+ 、TF+/REST- 、TF-/REST+ 和TF-/REST-)。我们计算了在K562细胞中通过MPRAduo测量的这些组之间的中值表达水平的差异(D中值)(图4A)。使用TF+和TF-组(有或无REST)之间D中位数的方向,我们确信将329个TF中的281个分为两类:(1)当与REST共定位时,267个TF与阳性表达活性相关,(2)当与REST共定位时,14个TF与抑制活性相关(图4B,第一和第二象限中的红点和蓝点)。当不与REST共定位时,2类TF中没有一个与抑制活性显著相关,而一些与阳性活性相关。 第2类包括AFF1,6Cell Genomics3,100234,2023会开放获取文章A BC D E图3.非典型REST结合基序的间隔区长度影响阻遏(A) 规范REST结合基序的结构和非规范基序的分类。左半位点和右半位点由典型基序中的2-bp间隔区隔开根据两个半位点的取向和排列,对其他基序进行了分类。(B) 在具有En19的K562细胞中具有或不具有典型基序的REST结合位点的MPRAduo活性。灰色线表示阴性对照的中位数。(C) 在测试文库中的非典型基序的间隔区长度的分布(D) 在具有En19的K562中,非典型基序的间隔区长度对表达水平的影响。灰色线表示阴性对照的中位数。(E) 间隔区长度的影响和K562中间隔区序列与En19的改组。灰色虚线表示阴性对照的中值,灰色实线表示野生型非典型基序的中值。**adjp 0.01,*adjp 0.001,通过U检验与阴性对照(B和D)或野生型(E)使用BH校正。CHAMP1、CREB3、HINFP、MIER1、NCOA 6、PTRF,PTTG1,和EHMT 2在MPRAduo中显示出显著的抑制,而 与REST 相关的 RE 1和MIER1或EHMT 2均未显示出沉默效应(图4F)。此外,RE 1与MIER 1和/或EHMT 2相关,而不是REST增加报告基因表达。通过比较乱序和天然基序测量的REST基序贡献在与所有三种TF相关的RE1中最高,这表明MIER1和EHMT2需要一个REST基序促进RE1的抑制(图4G)。我们重新-TEAD 2、TRIP 13、ZNF 197、ZNF 644和ZNF 766以及EHMT2是REST的一个已知的辅因子,而第1类包括两个已知的辅因子:RCOR 1和HDAC 2。类别中的所有14个TF与具有弱基序的位点相比,2在具有强REST基序的RE1序列处显著富集,而191个1类TF显著耗尽,表明活性RE1募集REST依赖性阻遏物并排除REST非依赖性激活物(图4C)。我们计数了定位于每个RE1序列的2类TF的数量,并观察到与依赖于REST的阻遏活性的相关性,表明它们的募集对于阻遏是重要的(图4D和4 E)。我们接下来关注在我们的RE 1序列中具有最高富集的强REST基序的两种2类TF; EHMT 2通过REST在RE 1处募集以抑制基因表达,18并且MIER 1通过其ELM 2和SANT结构域与EHMT 2和HDAC相互作用。为了评估MIER 1和EHMT 2共定位对沉默子功能的影响,我们比较了MIER 1、EHMT 2和/或REST在基因组背景下的报告蛋白活性和定位与REST相关的RE1,MIER1,推测了HepG 2细胞中MIER 2(MIER 1的一种变体)、EHMT 2和REST的阻遏和共定位之间的相关性,其不包含MIER 1 ChIP-seq数据,表明MIER蛋白对RE 1的冗余功能(图S8)。值得注意的是,我们没有观察到与HDAC 2和RCOR 1相关的RE 1序列的显著抑制,其被鉴定为1类TF(图4H)。然而,与REST和HDAC 2相关的REST基序显示出显著的基序贡献,表明HDAC 2定位于基因组中的功能性RE 1沉默子,但它不是沉默子的足够标记物(图41)。事实上,具有强REST基序的RE 1显著降低表达水平,而不管与RCOR 1和HDAC 2的关联如何,但是当与两种辅因子定位时,显示出更强的抑制(图S9A)。为了证实辅因子在天然基因组背景下定位的差异,我们比较了K562中的ChIP-seq峰,发现弱基序显示EHMT 2和MIER 1的占用率较低,但RCOR 1和HDAC 2的占用率较宽,而所有四种辅因子在具有强基序的RE 1处显示较高的EHMT2的这种偏好,会开放获取文章Cell Genomics3,100234,2023年1月11日7A BC D EF G H I图4. REST辅因子(A) 根据每个TF和REST的ChIP-seq对具有规范基序的RE 1进行分组然后,绘制各组之间表达水平中位数的差异,以根据其REST依赖性对TF进行分类。(B) 在K562中使用TF ChIP-seq和在具有En 19的K562中使用报告子活性的分类图红点是尽管REST共定位但具有显著差异的TF蓝点和绿点分别是仅在有或没有REST的情况下具有显著差异的TF(通过U检验,BH校正的adjp 0.05)。(C) 与所有测试的典型RE1相比,K562中RE1处TF定位的富集具有强基序红点是显著富集的TF(通过Fisher精确检验,p 0.05(D) K562中局部2类TF的数量与MPRAduo和En19表达水平的相关性(E) K562中局部2类TF和REST基序贡献的数量与En19的相关性(箱形图,左轴)。红线表示每个箱的REST结合位点的比例(右轴)。(*adjp 0.05,** adjp 0.01,* adjp0.001,通过U检验比较组(B)、阴性对照(D、F和H)、与一个TF结合的RE 1(E)或使用BH校正的三阴性组(G和I)。会开放获取文章8Cell Genomics3,100234,2023A BC DMIER 1与强REST基序的结合与两种辅因子共定位位点处的REST ChIP-seq信号增加一致(图S9D)。我们还评估了K562中RE1靶点的基因该观察结果与基序强度无关,而当与HDAC 2和REST相关时,仅在强基序的情况下显示RE 1的抑制(图S9C)。总的来说,这些结果表明,MIERs,EHMT2,和可能的其他2类TF在RE1的抑制中起着至关重要的作用。强RE1具有消音功能在人类基因组为了进一步验证RE1位点的功能,我们敲除了5个具有REST结合基序的基因座,其结合评分大于REST m值,富集了包括EHMT2和MIER1的2类TF,并在所有四种细胞类型中显示出显著的抑制,如通过MPRAduo测量的。我们使用CRISPR-Cas9敲除HCT 116细胞中的靶标,切割和插入/缺失(indel)效率范围为31.9%至94.5%(图S11A;表S12)。我们使用大量RNA的30个标签测序(BRB-seq)测量了编辑的和非靶向阴性对照之间的差异基因表达39敲除REST基序后,3个位点显示至少1个邻近基因的表达增加,这与REST基序的释放一致图5.强RE1的KO改变基因表达( A和C)靶向RE1的基因组序列。用于KO的SpCas9的指导序列和PAM序列与典型的REST结合基序一起显示所示基序来自JASPAR(MA0138.2)。(B和D)通过BRB-seq测量的附近基因的归一化独特分子标识符(UMI)计数。基因组图谱显示在底部,靶位点由蓝色条指示。* 通过Wald检验,adjp 0.001介导的抑制。在1个基因座处,我们观察到单个附近基因的表达降低,并且对于1个基因座,在编辑位点附近没有显著的表达变化(图4和S11;表S13)。有趣的是,3个验证的编辑中有2个在RE1位点远端有表达变化。一个基因座具有两个基因(MYL9和RAB 5IF)的增加的表达,这两个基因都在DLGAP 4的内含子内的RE 1位点的远端(图5A和5B)。第二个基因座,SLC5A5内含子内的RE 1位点,在Cas9介导的缺失后增加了相邻基因CCDC 124的表达水平(图5C和5D)。在第三个验证的位点,我们观察到RE1对EPHA 10的短程调节,其位于在EPHA 10的第一内含子内的启动子下游约500-bp处(图S11D和S11 E)。这些结果证实了具有强REST结合基序的RE1位点作为沉默子抑制基因表达,并且MPRAduo可以识别和重现RE1的内源性功能。人类基因组TF结合基序富集与人类疾病相关的精细映射变体。为了理解REST 结 合 基 序 周 围 变 体 的 效 应 大 小 和 分 布 , 我 们 使 用MPRAduo测试了位于REST基序中的各种等位基因频率的1,450个变体以及位于距REST基序25 bp内的2,348个变体(图6A)。我们比较了等位基因之间的表达水平(“等位基因偏斜”),并鉴定了等位基因之间显示显著差异表达的变体(“表达调节变体[emVars]”)。检测到REST基序内的642个emVar和REST 基 序外 的858 个emVar, 大多 数来 自 K562 和SK-N-SH(FDR 0.01;图S12;表S14)。&与外部相比,em-Var在强结合基序内部富集(优势比2.89,通过Fisher精确检验,p = 5.32±10- 12),但在弱结合基序内部不富集(优势比= 1.12,p =0.171)。此外,与弱基序或落在基序之外的变体相比,落在强基序内的变体显示更大的等位基因偏斜(图6B和S13A)。用MPRAduo测量的等位基因偏度与等位基因活性的正交测量结果一致,显示出与等位基因活性的强相关性。会开放获取文章Cell Genomics3,100234,2023年1月11日9A B CD EFGH图6.强基序丰富强变体(A) 等位基因偏斜以测试在典型REST结合基序内部或外部的变体的效果。在MPRAduo中测试参考(Ref)和替代(Alt)等位基因两者,并且活性的差异被测量为等位基因偏斜。(B) 相对于REST结合基序,等位基因偏斜的绝对值沿变体位置的分布绘制了K562中关于强基序(顶部)和弱基序(底部)周围的变体的En19的等位基因偏斜浅绿色突出了典型的REST结合基序(JASPAR MA0138.2)。(C) 等位基因偏斜与δ结合评分的相关性将K562中与En19的等位基因偏斜相对于等位基因之间的预测结合评分的差异作图(D) TSNARE 1基因座中rs 28396985和H3 K27 ac ChIP-seq信号的位置G,GM12878; H,HepG2; K,K562; S,SK-N-SH。(E) 含有rs28396985的每个等位基因的RE 1与En19的MPRAduo活性。误差线表示SE。* 表示1% FDR。(F) 人大脑中TSNARE1表达rs28396985的eQTL信号对每个等位基因绘制TSNARE1的归一化表达水平(G) 不同MAF中SK-N-SH中En 19的等位基因偏斜分布。(H) 全基因组强REST结合基序处变体的δ结合评分和MAF之间的相关性*adjp 0.05,***adjp 0.001,通过U检验与使用BH校正的0.001% MAF进行比较。会开放获取文章10Cell Genomics3,100234,2023强基序位点处等位基因之间的预测结合得分(δ结合得分)的差异,而弱基序位点处的等位基因之间的预测结合得分的差异不相关(图6C和S13B)。这些结果证明了在考虑变体对REST结合的影响之前,首先鉴定落入具有高于REST m值的结合得分的强基序的影响强REST基序的emVAR的一个实例是rs28396985,其位于TSNARE1的内含子中(图6D和S13C)。rs28396985位于CTCF结合的CRE处,如通过H3K27ac或H3K4me3测量的,没有任何活性标记5在该变异体的下游有两个CTCF结合基序17-bp和119-bp,它们不与任何已知的常见变异体重叠相对于A等位基因,G等位基因显示出表达的显著增加(图6E),这与预测的REST δ结合 评分一致 (A 等位 基因为 34.1,G 等位 基因为30.4)。我们证实REST优先结合A等位基因,如通过ChIP-seq在 GM 12878和 K562 中 测 量 的 , 其对 于 变 体 是 杂 合 的 ( 图S13D)。通过GTEx的表达数量性状基因座(eQTL)结果显示,TSNARE1的表达在包括小脑和脾的多个组织中通过G等位基因增加,表明变体在体内的显著作用与使用MPRAduo测量的作用一致(图6F)。RE1调节变体显示人口的为了了解REST结合位点的遗传变异如何影响功能,我们询问了等位基因频率和REST活性之间的关系。对于大多数主要等位基因,如通过总体等位基因频率估计的,我们观察到预测的REST结合评分和MPRAduo的抑制作用比相应的次要等位基因更强(图6C)。由于我们仅从四种细胞类型中选择了REST ChIP-seq峰的变体,因此这种效应可能是由于对创建REST结合位点的罕见或低频等位基因的然而,即使在基于低(1%)和中至高(>5%)等位基因频率对变体进行分箱之后,我们仍然观察到在低频率下最强的显著效果(图6G)。为了进行公正和详尽的评估,我们接下来鉴定了所有已知的变异,包括常见和罕见的,这些变异被预测会在人类基因组中产生REST结合基序,而不管它们与现有的REST ChIP-seq峰是否重叠。我们确定了10,069个变体,其中任一等位基因都有助于强REST结合基序,然后比较了主要和次要等位基因之间的预测结合得分。由于我们观察到与MPRAduo的强相关性,我们使用δ结合分数作为REST活性改变的代表。与MPRAduo观察到的不平衡一致,较低的次要等位基因频率(MAF)变体具有比较高MAF变体显著更低的δ结合评分(其对应于MPRAduo的高等位基因偏斜),其在正值和负值之间更均匀地分布(图6H)。为了确定基线预期,我们创建了表现出与最低MAF组(0.001%)相似的负δ结合评分的随机从头变异体。这些发现表明,低频率变异代表一个随机过程,在流行病学中等位基因频率增加的等位基因形成过程可能会经历选择性压力,以对抗已建立的REST结合位点的破坏。讨论在这项研究中,我们使用MPRAduo表征了全基因组RE1沉默剂,这使我们能够帮助我们检测抑制作用的能力。我们凭经验确定了REST的m值,RE 1,其中高于该m值的结合得分可能通过招募辅因子(包括MIERs和EHMT 2)来建立有效的沉默子。我们注意到,低于REST m值的弱结合基序与REST ChIP-seq峰重叠MPRAduo的检测限可能会排除我们检测弱结合位点抑制效应的能力,或者检测所需的局部和远端序列的丢失可能会影响局部REST结合动力学。42或者,REST可能具有结合阈值,必须克服该阈值才能与其辅因子相互作用并成功沉默。有趣的是,许多1类激活剂定位于基因组中的弱REST结合位点;这些激活剂可能解释了为什么在我们的研究中具有弱结合位点的RE 1序列更经常增加报告基因表达,并且也可能影响弱位点的REST结合。总之,观察结果表明,弱REST基序单独不太可能在主动沉默基因表达中发挥作用,并且在微调CRE功能时可能只有微弱的作用第2类中的TF在与REST一起定位时是抑制性的,但当它们在没有REST的情况下出现时,与表达的增加或可忽略的影响相关,这意味着一些TF能够依赖于其周围环境的抑制和激活功能 43 ,44EHMT2的这种双重作用已经得到证实,结合位点和磷酸化起着关键作用。我们的研究结果表明,REST与强基序结合时,可能有助于转换TF的功能,以促进沉默子活性。在我们初步筛选MPRA中的阻遏元件时,我们确定了一个能够降低报告活性的CTCF位点子集。CTCF是通过促进三维染色质环来维持TADs的关键因子另一方面,CTCF最初被发现为c-Myc的转录抑制子,49并且CTCF结合位点显示绝缘子/增强子阻断剂功能,其抑制CRE之间的相互作用,48,50支持CTCF的多功能作用。MPRAduo显示出显着的抑制CTCF结合位点位于ESTA边界时,测试旁边的一些特定的E元素。此外,这些CTCF结合位点位于E元件上游时表现出需要使用MPRAduo进行进一步探索,以了解CTCF结合位点抑制的分子机制以及相邻TF如何影响功能。我们的研究结果表明,在非典型REST中沉默活性需要8或9bp的间隔区长度。这些发现与在REST ChIP-seq37、38中观察到的富集一致,其中REST通过构象变化稳定地结合至8-或9-bp缺口基序,所述构象变化具有未结合的第六锌指会开放获取文章Cell Genomics3,100234,2023年1月11日11在两个半位点之间延伸。51尽管对半位点组合进行了验证性测试,但我们没有观察到任何其他构型的沉默,而是检测到一些构型的表达增加,这可能是侧翼序列的影响,类似于我们对弱典型结合位点的观察。我们没有发现8- 9-bp间隔区的共有序列;然而,通过扰乱间隔区,我们确实观察到活性略有增加,表明间隔区内编码有一定程度的隐蔽约束。虽然大多数TF结合基序是使用具有固定长度的位置权重矩阵(PWM)来描述的,但是已经发现了一些具有可变间隔区长度的TF结合基序。52,53我们的研究结果强调了发现具有可变缺口长度的基序的重要性以及进行功能验证的实用性。我们确定了基因组中RE1处2类TF的积累与MPRAduo测量的抑制相关,表明2类TF与RE1处的REST相关,以促进沉默功能。MIER家族已被证明与REST以及EHMT2发生物理相互作用,这表明MIER有助于REST和EHMT2在蛋白质复合物中的相互作用ZNF 644是一种锌指TF,也与EHMT 2结合,为2类TF作为RE 1的介质的作用提供了额外的支持第2类还包括先前不与RE1复合物相关的蛋白质,如TRIP 13,一种在减数分裂期间起作用的56我们证实ZNF 644和TRIP 13的定位与MPRAduo中RE 1的抑制以及其基因组背景中靶基因表达的抑制相关(图S10)。然而,需要进一步验证基因组内REST和第2类 TF之间相互作用的直接证据结论尽管全基因组关联研究是发现与性状相关的变异的有力工具,但将因果变异从紧密连锁不平衡的其他变异中分离出来是一个挑战。40,57染色质标记和功能测定(包
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功