没有合适的资源?快使用搜索试试~ 我知道了~
资源人类视网膜的单细胞多组和深度学习提名复杂眼病的因果变异图形摘要亮点d人类视网膜的单细胞RNA和染色质分析表征了13种细胞类型d人视网膜的H3 K27 ac HiChIP识别增强子-促动子连接深度学习预测单碱基变化对染色质可及性d综合方法优先考虑复杂眼病中的非编码风险变体作者肖恩·K Wang,Surag Nair,RuiLi,...,放大图片作者:ChristyLuong,Anshul Kundaje,Howard Y.常对应howchang@stanford.edu简言之Wang等人提出了一个成人视网膜的基因表达和染色质可及性的联合单细胞图谱,他们用它来分析来自五种眼科疾病的全基因组关联研究他们将该图谱与染色质构象数据、表达数量性状基因座和深度学习模型相结合,为数百种与视觉障碍有关的非编码变体提名视网膜中的基因和细胞靶点。Wang等人,2022,细胞基因组学2,1001642022年8月10日-作者。https://doi.org/10.1016/j.xgen.2022.100164人类视网膜scRNA-seq + scATAC-seqHiChIP增强子连接体非编码SNP表达数量性状基因座眼病GWAS基本分辨率深度学习会会开放获取资源人类视网膜的单细胞多组和深度学习提名复杂眼病的因果变异肖恩·K王,1,2苏拉格奈尔,3李锐,1卡捷琳娜卡夫,1阿努斯里潘帕里,3阿曼帕特尔,3乔伊斯B。康,4,5克里斯蒂梁,1,6安舒尔昆达杰,3,7和霍华德Y。张1,8,9,*1个人动态调节组中心,斯坦福大学,美国2斯坦福大学医学院眼科学系,斯坦福大学,美国3斯坦福大学计算机科学系,斯坦福大学,美国4美国马萨诸塞州波士顿哈佛医学院生物医学信息学系5数据科学中心,布里格姆妇女6美国加利福尼亚州斯坦福大学医学院化学与系统生物学系7美国加利福尼亚州斯坦福大学医学院遗传学系8美国加利福尼亚州斯坦福市斯坦福大学霍华德·休斯医学研究所9引线触点* 通讯地址:https://doi.org/10.1016/j.xgen.2022.100164howchang@stanford.edu总结眼部疾病的全基因组关联研究(GWAS)已经确定了数百种与眼部疾病相关的遗传变异。然而,这些变异中的绝大多数是非编码的,这使得解释它们的功能变得困难在这里,我们提出了一个联合单细胞图谱的基因表达和染色质可及性的成年人视网膜超过50,000个细胞,我们用来分析单核苷酸多态性(SNP)涉及的GWAS的年龄相关性黄斑变性,青光眼,糖尿病视网膜病变,近视,2型黄斑毛细血管扩张症。我们将该图谱与HiChIP增强子连接组、表达数量性状基因座(eQTL)数据和碱基分辨率深度学习模型相结合,以预测在眼病中具有因果作用的非编码SNP,评估SNP对转录因子结合的影响,并定义其已知和新的靶基因。我们的努力提名致病SNP靶基因相互作用的多种视觉障碍,并提供了一个潜在的强大的资源,解释非编码的变化在眼睛。介绍眼部疾病如青光眼、近视和年龄相关性黄斑变性(AMD)的全基因组关联研究(GWAS)已经发现了数百种与眼部疾病相关的遗传16为了更好地理解非编码变体如何在机制上促进眼部病理学,绘制其相应基因座在哪些细胞类型中是活跃的将是有价值的。这一信息将为遗传复杂性眼病的细胞生物学提供新的见解,并有助于提名特定的细胞类型作为治疗靶点。研究非编码基因组的最新进展是单细胞多组学技术的发展,例如配对单细胞RNA测序(scRNA-seq)和用于转座酶可及染色质测序的单细胞测定(scATAC-seq)。虽然scRNA-seq可以基于它们的转录谱对组织的不同细胞类型进行分类,但是其与scATAC-seq的组合允许对组织的不同细胞类型进行额外的定位。细胞类型特异性染色质可及性。总之,这些技术可以揭示GWAS识别的非编码DNA元件的活性,并已用于询问阿尔茨海默病、帕金森病、自闭症谱系障碍和自身免疫等疾病的风险7-9非编码基因组的研究同样受益于分析创新,例如应用基于卷积神经网络(CNN)的深度学习来预测非编码多态性的影响。10- 12这一领域的进展最近导致了分辨率低至单个核苷酸的模型,使得能够精确确定顺式调节序列中的关键碱基。8,12,13这些模型提供了一种经过验证的方法来优先考虑具有功能相关性的非编码变体,并且特别适用于实验操作困难的组织。在这里,我们生成了由超过50,000个细胞组成的成人视网膜的联合scRNA和scATAC-seq图谱,并使用它来分析与五种眼病的GWAS有关的单核苷酸多态性(SNP):AMD、青光眼、糖尿 病 视 网 膜 病 ( DR ) 、 近 视 和 2 型 黄 斑 毛 细 血 管 扩 张 症(MacTel)。用HiChIP增强子连接体对该图谱进行分层,14Cell Genomics2,100164,August 10,2022<$2022作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取资源2Cell Genomics2,100164,2022表达数量性状基因座(eQTL)数据,15和碱基解析深度学习模型,12我们预测了在眼病中具有因果作用的我们的努力提名致病SNP靶基因相互作用的多种视觉障碍,并提供了一个潜在的强大的资源,解释非编码的变化在眼睛。结果单细胞多组学揭示人类视网膜细胞类型的基因表达和染色质可及性景观为了产生人视网膜的单细胞多基因组,我们对来自四个没有眼睛疾病史的个体的八个死后视网膜进行联合scRNA和scATAC-seq分析(表S1)。在质量控制过滤(图S1)和去除推定的双联体(图S2A和S2 B)后,我们在22个簇中获得了总共51,645个人视网膜细胞,我们将其分配给13种不同的细胞类型(图1A、1B和S2C)。这些包括丰富的细胞类型,如视杆细胞光受体和米勒神经胶质细胞,以及较罕见的细胞类型,如星形胶质细胞和小神经胶质细胞,它们各自仅占所分析细胞的0.4%(图 1C;表S2)。与已发表的人视网膜scRNA-seq研究一致,16-我们还基于13种细胞类型中的每一种的差异表达鉴定了候选标记基因的列表(数据S1)。使用来自联合多组学分析的共享条形码将scATAC-seq图谱分配给由scRNA-seq表征的13种细胞类型所得的染色质可及性概况按细胞类型聚类(图S4A),并且与来自公共人视网膜scATAC-seq数据集的那些高度相似(图S3B),支持我们的多组的有效性。对来自每种细胞类型的scATAC-seq谱进行的峰识别,其组合成假批量ATAC重复,发现总共620,386个染色质可及性峰(图2A;数据S2)。这些scATAC峰在供体之间是一致的(图S4B和S4 C),并且包括来自公开的人视网膜的批量ATAC-seq研究的超过90%的峰(图2B),20表明单细胞多 组 学 可 以 概 括 批 量 ATAC-seq 数 据 。 相 反 , 超 过 一 半 的scATAC峰对于单细胞数据集是独特的(图2B),并且近40%的scATAC峰仅在一种细胞类型中可接近(图S5A)。与此一致,我们发现197,826个scATAC标记物峰以细胞类型特异性方式富集(图2C;数据S3),包括许多位于细胞类型特异性基因附近(图2D)。利用这些scATAC峰,我们进行了基序富集分析以预测哪些转录因子(TF)在每种细胞类型中可能是有活性的(图3A;数据S4)。根据已发表的文献,我们观察到具有已知细胞类型特异性功能的TF的结合基序的富集,例如光感受器和双极细胞中的OTX2,水平细胞中的21个ONECUT家族成员,视网膜神经节细胞中的22个POU4F家族成员,小胶质细胞中的23个24对于一些TF,scATAC峰的足迹分析也支持细胞类型特异性活性(图3B),其揭示了保护基序中心免于Tn5转座,与TF占用一致。这些数据提供了成人视网膜中候选TF的细胞类型特异性目录,并可能有助于我们理解控制视力的基因调控网络。单细胞多组学揭示了眼部疾病GWAS所涉及的变异体的细胞背景通过我们的单细胞多基因组,我们试图更好地了解复杂眼部疾病的GWAS识别的风险位点。为此,我们汇编了来自NHGRI-EBIGWAS目录的1,331个独特索引SNP的列表,其代表五种眼病的GWAS命中:AMD、青光眼、DR、近视和MacTel(图4A;表S3)。这些SNP中的绝大多数(96.5%)位于基因组的非编码区,因此无法单独使用scRNA-seq数据进行解释。我们对所有指标SNP进行了连锁不平衡(LD)扩展,以包括具有高共遗传概率的邻近变体(LDR2> 0.9,基于来自1000个基因组项目的3期基因型)(图S5B)。[26]由此,我们在与复杂眼病相关的基因座中共获得了7,100个SNP,其中7,034个(99.1%)是非编码的。我们首先检查了编码氨基酸变化或提前终止密码子的少量LD扩展SNP(数据S5)。使用我们的scRNA-seq数据,我们发现AMD和青光眼中涉及的编码变体分别在小胶质细胞和缪勒胶质细胞中最强烈地表达(图S6A)。作为比较,我们还基于来自视网膜信息网络的基因注释评估了已知引起单基因视网膜疾病的突变的细胞类型表达(图S6B)。27与预期一致,原发性光感受器疾病的基因,如视锥-视杆障碍和色素性视网膜炎,在视杆和视锥中表达最高,而视神经萎缩的疾病基因,以视网膜神经节细胞变性为标志的疾病,在这种细胞类型中表达最高我们接下来转向LD扩增后定位于非编码基因组的7,034个独特SNP(数据S6)。为了确定这些SNP在哪些视网膜细胞类型中可能是活性的,我们将SNP位置与来自我们的数据集的scATAC峰重叠。我们发现1,152个非编码SNP(16.4%)与scA-TAC峰重叠(图4B、S5C和S5 D),并且大多数含SNP的峰仅存在于一种或两种细胞类型中(图S5E)。然后,我们进行了两次正交分析,以完善我们的SNPs列表,这些SNPs更可能具有基因调控功能。首先,我们鉴定了scATAC峰中与启动子区域中的峰共同接近的SNP,从而推断这将选择活性增强子中的SNP我们在人视网膜中检测到39,552个这样的启动子峰,其中58.3%与至少一个scATAC峰共同接近(图4C)。利用我们配对的scRNA和scATAC-seq数据,我们还搜索了与附近基因表达相关的可及性的峰中的SNP,并将符合这一标准的基因使用这种方法,我们预测了靶基因,Cell Genomics2,100164,2022年8月10日3会开放获取资源●●●●●● ●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●A B棒锥杆非锥形双极(5簇)水平开锥双极杆状双极GABA-无长突视网膜神经节细胞小胶质Müllerglia10离锥双极甘 氨 酸- 无 长突胶质细胞缪勒胶质(2组)ON锥双极(4簇)棒双极锥体GABA-无长突(2簇)水平C806040视网膜神经节细胞0全无长突碱星形胶质细胞200-10D杆离锥双极缪勒胶质开锥双极-10 0UMAP_1表达百分比●0● 255075杆双极锥体GABA-无长突碱水平甘氨无长突碱视网膜神经节细胞全无长突碱星形胶质细胞平均表达2.52.01.51.00.50.0-0.5图1.来自联合scRNA和ATAC-seq的转录谱识别人类视网膜的主要细胞类型(A) 人类视网膜的示意图,描绘了本研究中分析的细胞类型。(B) 在质量控制过滤和去除推定的双联体之后,通过scRNA-seq检测的51,645个人视网膜细胞的均匀流形近似和投影(UMAP)图对来自四个供体的八个死后视网膜进行了分析。总共22个簇被解析并分配给13种细胞类型。(C) 通过scRNA-seq确定的人类视网膜中不同细胞类型的频率每个条形上方的数字表示51,645中的绝对计数(D) 通过细胞类型可视化选定标记基因的标准化RNA表达的点图每个点的颜色和大小分别对应于表达细胞的平均我们 的数据 集中的 620 ,386 个scATAC 峰中 的199, 055个( 32.1% ) ( 图 4D 和 S5F ) 。 对 于 这 些 峰 中 的 近 一 半(44.3%),我们的预测与线性基因组上最近的基因不同(图S5G),表明非编码SNP不一定调节其最近的基因。我们在scATAC峰中鉴定了241个与启动子峰可共访问的SNP和374个预测靶基因的SNP作为一个例子,我们检查了位于TRIOBP内含子上的rs4821699,大约22岁。该基因座与多种GWAS引起的青光眼有关,并编码一种被认为调节细胞骨架组织的蛋白质 2 , 28 , 29我们观察到rs4821699在视网膜神经节细胞中最易接近(图4E),视网膜神经节细胞是在青光眼期间经历变性的主要细胞类型基于与基因表达的相关性,预测含有该SNP的峰靶向TRIOBP。因此,我们假设rs4821699可能通过改变视网膜神经节细胞中TRIOBP的表达而在青光眼中发挥作用n = 51,645个细胞●●●●●●●细胞类UMAP_2细胞%4Cell Genomics2,100164,2022会开放获取资源峰数(x103)一个6005004003002001000B唯一重叠8006004002000C197,826峰杆离锥双极Müller胶质细胞ON-锥形双极棒双极锥形GABA-无长突水平Gly-无长突视网膜神经节细胞小胶质-2.0Z列2.0D棒偏心锥双极缪勒胶质开锥双极PDE6AGRIK1RLBP 1GRM6NIF3L1ARR3GAD 2ONECUT1 SLC6A9 NEFL CALB2 PAX2 HLA-B1杆双极锥体GABA-无长水平Gly-无长突视网膜神经节细胞所有-无长突星形胶质细胞小胶质细胞基因图2.来自人类视网膜联合scRNA和ATAC-seq的染色质可及性概况揭示了细胞类型特异性表观遗传景观(A) 通过scATAC-seq测定的每种细胞类型的染色质可及性峰的数量要求峰存在于至少两个假批量ATAC重复中(星形胶质细胞和小胶质细胞n = 2,所有其他细胞类型n = 5)。(B) scATAC峰与来自公开的人视网膜批量ATAC-seq数据的峰的重叠重叠定义为具有任何重叠碱基的峰(C) 在每种细胞类型中富集的scATAC标志物峰的热图。每列代表一个标记峰。(D) 按细胞类型对选定标记基因附近的染色质可及性进行测序每个轨道表示来自给定细胞类型的所有细胞的聚集scATAC信号,其通过TSS区域中的读数总数标准化有义方向的基因(左边的TSS)以红色显示,反义方向的基因每个区域的坐标如下:PDE 6A(chr 5:149924792(chr21:29905031 - 29955033)、RLBP 1(chr15:89201750 - 89241751)、GRM6(chr5:178975297 - 179015298)、NIF3L1(chr2:200874325 -200914327)、ARR3(chrX:70248304 - 70288305)、GAD 2(chr10:26186306 - 26246307)、ONECUT 1(chr15:52781076 - 52821078)、SLC6A9(chr1:44005465 - 44035467)、NEFL(chr8:24937109 - 24977110)、CALB 2(chr16:71323711 - 71368713)、PAX 2(chr10:100715602 -100755603),和HLA-C(chr6:32419841 - 32459842)。已经使用来自诱导多能干细胞的视网膜类器官对与眼部疾病相关 的 少 数 SNP 进 行 了 实 验 研 究 。 一 种 这 样 的 SNP 是rs17421627,来自MacTel的GWAS的索引SNP,代表5号染色体上的T至G置换5,30我们确定rs17421627是具有预测靶基因的MacTel仅有的五个SNP之一,并且发现该SNP在小鼠中最容易获得,并且作为靶基因(图4E)。使用相关基因表达数据,我们还预测rs17421627作用于LINC00461,一种长的非编码RNA。与这些预测一致,缺失含有人视网膜类器官中的rs17421627已显示显著下调LINC00461,在小鼠视网膜中具有最强的作用。31.这些实施例揭示了如何通过电子细胞显微镜揭示视网膜中非编码变体的细胞靶点,并显示它们如何导致眼部疾病。单细胞多基因组与HiChIP和eQTL数据的整合验证了SNP靶基因预测为了进一步优先考虑我们的SNP列表,我们将我们的数据与两种互补的方法结合起来,用于鉴定功能性SNP基因,远端Intronic外显子启动子棒关闭锥双极Müllerglia ON-cone双极棒双极锥体GABA-无长突碱水平甘氨酸无长突视网膜神经节细胞全无长突星形胶质细胞联合峰数(x103)Cell Genomics2,100164,2022年8月10日5会开放获取资源的杆离锥双极Müllerglia ON-cone双极棒双极锥体GABA-无长突碱水平甘氨酸无长突蛋白视网膜神经节细胞全 无 长 突 星形胶质细胞-log10(调整后的P)050 100 150 200B1.20.60.00.80.40.00.20.0-0.20.30.20.10.0-200-1000100200-200-1000100200-200-1000100200-200-1000100200到基序中心的距离(bp)到基序中心的距离(bp)到基序中心的距离(bp)到基序中心的距离(bp)杆离锥双极缪勒胶质开锥双极棒双极锥体GABA-无长突水平视网膜神经节细胞全无长突星形胶质细胞小胶质图3.人类视网膜可接近DNA区域的模体分析预测细胞类型特异性TF(A) 在每种细胞类型中富集的所选TF结合基序的热图较深的颜色表示更显著的富集。(B) 跨细胞类型的所选TF的足迹分析。通过从足迹信号中减去Tn5插入信号来校正足迹的Tn5插入偏倚。全基因组的相互作用。我们首先对乙酰化组蛋白H3赖氨酸27(H3K27ac)(活性增强子和启动子的标记)进行HiChIP,32以表征人视网膜的三维(3D)增强子“连接体”14,33我们发现了由9,670个HiChIP环连接的16,692个环锚,包括染色质可接近细胞类型特异性基因的转录起始位点(TSS)的几个连接区域(图S7C;数据S7)。在这些环中,超过95%与两个锚中的scATAC峰重叠,超过99%与至少一个锚中的峰重叠(图5A)。该结果表明,在scATAC-seq数据中鉴定的可接近的染色质位点具有活性增强子的生物化学特征,并支持它们与靶基因的连接。我们还使用来自眼基因型表达(EyeGEx)数据库的已发表的人视网膜eQTL数据分析了我们的SNP列表。对于scATAC峰中超过90%的SNP,视网膜eQTL数据是可用的(图5B),使得能够在整体组织水平上鉴定我们在scATAC峰中发现了187个疾病相关的SNP,这些SNP通过H3K27ac HiChIP环与基因相连这些包括rs9966620,来自DR的GWAS的顶部SNP,代表18号染色体上TTC39C34使用我们的多基因组,我们确定scATAC峰浓度为rs9966620在棒中最容易获得(图5C)。然而,这个峰值也与多个靶基因的表达相关,阻碍了解释SNP如何发挥作用的努力。通过分析我们的HiChIP数据,我们能够定位连接rs9966620与上游75 kb区域的3D环。该区域仅限制了一个基因TTC 39 C-AS 1的TSS,表明rs 9966620可能通过与视杆细胞中的TTC 39 C-AS 1相互作用来调节DR风险我们还在scATAC峰中检测到596个疾病相关SNP,这些SNP通过eQTL分析与基因显著相关一个例子是rs2730260,这是VIPR2内含子中的SNP,与近视有关。[35]该基因座编码两种已知的血管活性肠肽(VIP)受体之一,VIP是一种参与视觉处理的信号分子36我们发现,rs2730260在一个基因组中被识别,如果多个基因组再次具有多个预测的靶基因,则在一个基因组中被识别的基因组是不稳定的(图5C)。视网膜eQTL数据澄清了这种模糊性,其显示rs2730260处的变异仅与VIPR2的表达显著相关(图5D),支持该基因作为SNPeQTL数据的整合同样改善了我们对AMD的FRK-NT5DC 1-COL 10A1风险基因座中6号染色体上rs66475830的解释37,38该区域在一个兆碱基的跨度内包含近20个基因,使得在功能上注释GWAS命中特别根据我们的单细胞数据,Otx2LHX2ONECUT1SPI1TCF4ZEB 1RHOXF1神经元1FOSJUNLHX2HLFNEUROD4TEFDMBX1POU2F1OTX2PITX3CRXGATA 1MEIS1RFX2RFX3RFX4ONECUT1ONECUT2ONECUT3TFAP2ATFAP2BNHLH1NHLH2TCF 12EBF 1NR1D2POU4F1POU4F2POU4F3RORANEUROD2NEUROG2PAX5ZNF263SP3ELF1ETV6SPI1Tn5偏倚校正的标准化插入会开放获取资源6Cell Genomics2,100164,2022AMD青光眼DR近视MacTel一#索引SNPLD扩增后的SNP数量LD扩增后的非编码与scATAC峰值相交AMD青光眼DR近视7,034个独特的SNPMacTelB108642012437759 581 13C可与启动子峰504030E杆离锥双极缪勒胶质开锥双极chr22rs4821699(青光眼)chr5rs17421627(MacTel)20100共可及峰数量杆双极锥体GABA-无长水平D预测靶基因806040200预测的靶基因数量Gly-无长突视网膜神经节细胞所有-无长突星形胶质细胞小胶质基因37,700,00037,750,0008852.5万8857.5万图4.单细胞多组学精确定位眼病中非编码变体的细胞靶点(A) 用于询问眼部疾病GWAS的SNP选择的概述对从每种疾病的GWAS获得的索引SNP进行LD扩增,并且所得非编码SNP与scATAC峰重叠。(B) 与每种细胞类型的染色质可及性峰重叠的来自每种疾病的LD扩增的非编码SNP的百分比(C) 与每个启动子峰共同可及的scATAC峰的数量。共可及性定义为scATAC峰,其可及性显示相关性评分大于0.3。(D) 每个scATAC峰的预测靶基因的数量预测的靶基因被定义为RNA表达显示相关性得分的基因>0.3,相对于测试的scATAC峰的可及性。(E) rs4821699(chr22:37719685)和rs17421627(chr5:88551768)附近染色质可及性的测序轨迹有义和反义方向的基因每个SNP的位置由垂直灰线描绘。灰色弧表示含有感兴趣的SNP的scATAC峰的预测靶基因。确定rs66475830在无长突细胞和水平细胞中可接近,并预测TSPYL1和TSPYL4为靶基因(图5C)。视网膜eQTL分析显示,该位置的变异与TSPYL4表达显著相关,但与其他附近基因的表达无关(图5D),因此TSPYL4被认为是rs66475830的效应基因。最后,我们确定了HiChIP和eQTL数据支持的许多SNP-靶基因关系,例如分别位于近视和青光眼风险位点的rs77272443和rs4102217。对于这两种SNP,HiChIP和eQTL再次分析了精确的靶基因预测(图S8A和S8 B),证明了单细胞SNP和eQTL的组合如何影响靶基因的表达。LINC00461TRIOBPn = 39,552启动子峰n = 620,386个峰峰%与峰重叠的非编码SNP%启动子峰%172361130653227252,0898713,382847082,0748643,35681会开放获取资源Cell Genomics2,100164,2022年8月10日7-log10(调整后的P)AH3K27ac HiChIPn = 9 670H3K27ac HiChIP环路B视网膜eQTL关于EyeGEx100AMD青光眼C棒偏心锥双极缪勒胶质开锥双极100500chr18 rs9966620(DR)峰两个锚钉一个锚钉任一锚钉chr7 rs2730260(近视)7550250chr6博士近视MacTelrs66475830(AMD)杆双极锥体GABA-无长水平Gly-无长突视网膜神经节细胞所有-无长突星形胶质细胞小胶质基因H3K27ac1.59亿1.59亿Drs2730260116,000,000 116,200,000rs66475830HiChIP循环24,050,00024,150,0009 12696330 0图5.单细胞多基因组与HiChIP和eQTL数据的整合优先考虑人类视网膜中的功能非编码多态性(A) H3K27ac HiChIP环锚(n = 2个生物学重复)与scATAC峰的重叠。(B) 对于具有可用视网膜eQTL数据的每种疾病,scATAC峰值中的SNP百分比。(C) rs9966620(chr18:24100771)、rs2730260(chr7:159054238)和rs66475830(chr6:116087639)附近染色质可及性的测序轨迹有义和反义方向的基因每个SNP的位置由垂直灰线描绘。灰色弧表示含有感兴趣的SNP的scATAC峰的预测靶基因与rs9966620重叠的黑色弧表示H3K27ac HiChIP环,其区域被相反的锚点包围,以紫色突出显示。(D) 通过视网膜eQTL分析确定的rs2730260或rs66475830及其附近基因的SNP基因关联的意义。通过将EyeGEx数据库中列出的标称p值乘以针对该SNP测试的SNP-基因对的数量来计算每个基因的调整的p值。TTC39COSBPL1ATTC39C-AS1COL10A1 TSPYL4FRK DSENT5DC1 TSPYL1循环%-log10(调整后的P)具有视网膜eQTL数据的可访问SNP的百ViPR2WDR60LINC00689会开放获取资源8Cell Genomics2,100164,2022参比品(T)基本重要性评分候补(C)缪勒胶质预测的每碱基计数01,000SCARA3CLUMIR6843CAGAT CA AGTATGG C替代参考rs1532278●-log10(调整后的P)●●C不A细胞类型特异性ATAC-seq片段基于CNN的深度学习预测值/碱基B按细胞类型的非编码索引LD扩展LD在scATAC峰随机GScATAC峰值0.00.5 1.0 1.52.0高效百分比2.5C0.050.000.050.00500chr 8 rs 1532278(近视)[-同源结构域]0.050.000.050.00100chr16rs1874459(青光眼)[+bHLH结构域]50100 0杆离锥双极缪勒胶质开锥双极杆双极锥体GABA-无长水平Gly-无长突视网膜神经节细胞所有-无长星形胶质细胞基因D3027,580,000 27,640,000 65,000,000F20AC010533.110辆CDH110Grs18744590 5 1015-log10(调整后的P)表达百分比●●0 10 20 30 40 50平均表达-101 2EMüller神经胶质(同源结构域TF)NEUROD1NEUROD2NEUROD4NEUROD6NEUROG1NEUROG2NEUROG3(图例见下页)参比品(G)基本重要性评分候补(C)杆双极预测的每碱基计数01,000CDH11●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●杆偏锥双极Müller胶开锥双极棒双极锥GABA-无长水平无长甘-视网膜所有-神经节细胞无长突星形胶质细小胶质会开放获取资源Cell Genomics2,100164,2022年8月10日9多组学与其他检测可以增强对眼病中非编码变异的解释。单细胞多组与基础分辨率深度学习的整合提名了疾病相关SNP基于CNN的深度学习模型已被证明能够从其他非编码变体中识别疾病相关的SNP。作为对我们的数据集中的SNP进行优先级排序的最终方法,我们因此在13种视网膜细胞类型中的每一种的scATAC-seq谱上训练了源自BPNet架构的CNN(图6A、S9A和S9 B)。在每个SNP区域,我们使用对不同细胞类型特异的模型比较了这些计算使我们能够鉴定我们发现23个SNP(2.0%)位于scATAC峰中,其被定性为高效,比索引SNP、LD扩展的SNP、与GC含量匹配的随机SNP和位于scATAC峰中的随机SNP中的百分比更大(图6B;数据S8)。得分最高的SNP之一是rs1532278,这是一种与近视相关的索引SNP,位于8号染色体上CLU的内含子中。3我们的图谱预测rs1532278调节CLU,这是一个被eQTL数据强化的概念,并确定SNP在13种视网膜细胞类型中的9种中是可接近的(图6C和6D)。 尽管如此,碱基解析模型预测在rs1532278处的T至C转变,以在Mülleleglia中稳定地改变染色体,特别是通过改变同源结构域TF的基序。 我们的研究结果表明,尽管rs1532278在多种细胞类型中可接近,但由于细胞类型特异性同源结构域TF,它在对Müller glia的重新定位中没有作用。我们通过scRNA-seq数据(图6 E)以及来自动物模型的数据推测TF可由LH X 2诱导,在小鼠胶质细胞中表达逆转录酶。41另一个高效SNP是位于16号染色体上CDH11内含子中的rs1874459,该位点与青光眼的多个GWAS2,28使用我们的多基因组,我们发现rs1874459在视杆双极细胞中最容易接近,并预测CDH11是其靶基因之一,这一想法得到了eQTL数据(图6C和6F)。通过对碱基分辨率模型的分析,我们确定rs 1874459所代表的G-到-C颠换引入了一个新的碱性螺旋-环-螺旋(bHLH)结构域,该结构域有望增加杆状双极细胞、关闭锥双极细胞、开启锥双极细胞、gly-amama- crine细胞和AII-无长突细胞的可及性。在bHLH TF中,通过基序分析预测特别是neuroD和神经原蛋白家族的成员在这五种细胞类型中显著富集(图3A;数据S4)。因此,我们使用我们的scRNA-seq数据比较了所有neuroD和neurogenin家族成员,这揭示了仅NEUROD 4对双极细胞和无长突细胞具有特异性(图6G),这与其在发育期间指定这些细胞类型的作用一致。我们的研究结果表明,rs1874459可能通过创建NEUROD4识别的新bHLH结构域来作用于双极细胞和无长突细胞中的CDH11讨论在这项研究中,我们将单细胞多组学、HiChIP、eQTL分析和基础分辨率深度学习应用于人类视网膜,以破译非编码风险变体在五种眼部疾病中的作用。整合这些方法使我们能够预测视网膜中数百个SNP的基因和细胞靶点,并将数十个SNP命名为潜在的致病性和值得进行功能验证。从最初的7,000多个非编码SNP中,我们确定了1,152个位于染色质可及性峰。我们随后集中于SNP:(1)与启动子共同可接近,(2)其可接近性与附近基因的表达相关,(3)通过H3K27ac HiChIP环在3D空间中与基因连锁,(4)基于视网膜eQTL数据证明与基因显著关联,和(5)预测改变局部染色质可及性,如通过基础分辨率模型确定的。我们建议在未来的验证工作中优先考虑满足大多数或所有这些标准的SNP(图S10;数据S6我们的发现建立在最近的研究基础上,这些研究主要使用胎儿组织和干细胞衍生的类器官来绘制人类视网膜中细胞类型特异性染色质可及性。31,44这些研究的数据集是解码视网膜发育和理解先天性眼病的丰富资源然而,它们可能无法完全概括成熟视网膜的生物学特性,因此可能不太适合研究视觉。图6.单细胞多组与碱基分辨率深度学习的整合提名了疾病相关SNP的功能机制(A) 基于CNN的深度学习管道示意图。(B) 分类为高效的非编码索引SNP(n = 1,284)、LD扩展SNP(n = 7,034)、scATAC峰中LD扩展SNP(n = 1,152)、随机选择的GC匹配SNP(n = 9,984)和scATAC峰中随机选择的SNP(n = 1,160)的百分比(C) 上图:rs1532278(chr8:27608798)和rs1874459(chr16:65041801)分别在Mu€ller胶质细胞和视杆双极性细胞中的预测每碱基可及性,如由深度学习模型决定。100-bp窗口描绘了每个碱基对SNP处预测的可及性的重要性,并且1,000-bp窗口描绘了参考(蓝色)和替代(橙色)等位基因的预测的每个碱基计数SNP碱基以紫色突出显示对于rs 1874459,预测OFF-视锥双极、ON-视锥双极、gly-无长突和AII-无长突细胞的可及性变化相似底部:rs1532278和rs1874459附近染色质可及性的测序轨迹。有义和反义方向的基因分别以红色和蓝色显示每个SNP的位置由垂直灰线描绘灰色弧表示含有感兴趣的SNP的scATAC峰的预测靶基因。(D和F)rs 1532278(D)或rs 1874459(F)及其附近基因的SNP-基因关联的显著性,如通过视网膜eQTL分析确定的通过将EyeGEx数据库中列出的标称p值乘以针对该SNP测试的SNP-基因对的数量来计算每个基因的调整的(E)点图显示了M u c ller神经胶质中40个不同同源结构域TF的正常化RNA表达。所选择的TF对应于图10中的40个同源异型体a。如通过mot if分析所确定的,具有结合基序的因子在Mucller胶质细胞中最显著地被富集(数据S4)。(G)点图显示了按细胞类型划分的neuroD和neurogenin家族成员的标准化RNA表达。会开放获取资源10Cell Genomics2,100164,2022在以后的生活中出现的疾病。在这里,我们生成了单细胞多组,其通过精确定位成人视网膜中疾病相关SNP的细胞靶标来补充先前的数据集。我们将多基因组与多个正交分析相结合,以确定推定的SNP-靶基因相互作用。通过进行碱基分辨率深度学习,我们能够发现单细胞、HiChIP和eQTL数据中不容易发现的见解,例如SNP对TF结合的预测影响以及这些影响的方向性。为了便于使用,我们的地图集在https://eyemultiome.su.domains/上公开提供。该研究这项研究的局限性包括相对较少的细胞类型,如小胶质细胞和视网膜神经节细胞。用更多的细胞和供体扩展当前图谱将有助于解析功能上不同的细胞亚型,并可以揭示这里忽略的染色质可及性的亚型特异性区域。在SNP优先化过程中,使用来自大量视网膜的HiChIP和eQTL数据也可能有利于来自更丰富细胞类型的SNP。由于研究设计中的系统差异,GWAS命中和显著eQTL的有限重叠可能导致我们的优先标准之间的一致性较低。45最后,应该注意的是,我们检查的大多数SNP与任何染色质可及性峰不重叠,表明它们在视网膜中不活跃。我们假设这些未分配的SNP中的许多可能在眼睛的其他部位起作用,因此无法通过我们的分析捕获例如,虽然AMD和DR中神经视网膜受损,但视网膜色素上皮和血管系统分别被认为是病理学的主要部位。46,47在青光眼中,小梁网和睫状体可以调节疾病的严重程度,这一点通过作用于这些组织的治疗来证明。48同样,脉络膜和巩膜可能与近视有关,因为它们随着近视的增加而沿着视网膜伸长。49这些额外眼部区域的多组学特征将使我们能够更全面地了解非
下载后可阅读完整内容,剩余1页未读,立即下载
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 保险服务门店新年工作计划PPT.pptx
- 车辆安全工作计划PPT.pptx
- ipqc工作总结PPT.pptx
- 车间员工上半年工作总结PPT.pptx
- 保险公司员工的工作总结PPT.pptx
- 报价工作总结PPT.pptx
- 冲压车间实习工作总结PPT.pptx
- ktv周工作总结PPT.pptx
- 保育院总务工作计划PPT.pptx
- xx年度现代教育技术工作总结PPT.pptx
- 出纳的年终总结PPT.pptx
- 贝贝班班级工作计划PPT.pptx
- 变电值班员技术个人工作总结PPT.pptx
- 大学生读书活动策划书PPT.pptx
- 财务出纳月工作总结PPT.pptx
- 大学生“三支一扶”服务期满工作总结(2)PPT.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)