没有合适的资源?快使用搜索试试~ 我知道了~
文章对韩国生物库数据中72,298个个体的76个性状进行全基因组研究图形摘要亮点d韩国生物库中个体的GWAS确定了122种新的关联d多效基因和性状d一项包括韩国GWAS的荟萃分析提高了东亚人的风险预测准确性作者Kisung Nam,Jangho Kim,Seunggeun Lee对应lee7801@snu.ac.kr简言之缺乏对不同祖先群体的全基因组关联研究(GWAS),导致遗传发现不足。Nam等报告了韩国人76个性状的GWAS,确定了122个新的关联,并通过荟萃分析证明了多基因风险评分的预测性能的改善。Nam等人,2022,细胞基因组学2,1001892022年10月12日-作者。https://doi.org/10.1016/j.xgen.2022.100189会会开放获取文章对韩国生物库数据中72,298个个体的76个性状进行全基因组研究Kisung Nam,1Jangho Kim,1和Seunggeun Lee1,2,*1首尔国立大学数据科学研究生院,首尔08826,大韩2电极导线触点* 通讯地址:https://doi.org/10.1016/j.xgen.2022.100189lee7801@snu.ac.kr总结缺乏对不同祖先群体的全基因组关联研究(GWAS),导致遗传学发现和多基因评分不足我们对韩国生物库数据中的76种表型进行了GWAS,即韩国基因组和流行病学研究(KoGES)(n = 72,298)。我们的分析发现了2,242个相关基因座,包括122个新的关联,其中许多在日本生物银行(BBJ)GWAS中得到了复制。我们还应用了几种最新的方法进行遗传关联检验,以增加功效,发现在简单的病例对照GWAS中未发现的其他关联。我们评估了遗传多效性以研究与多性状相关的基因。在对KoGES和BBJ之间的32种表型进行荟萃分析后,我们进一步确定了379种新的关联,并通过使用荟萃分析结果证明了多基因风险评分的预测性能76个KoGES GWAS表型的汇总统计是公开的,有助于更好地理解东亚人群的遗传结构。介绍基于人群的生物库,如UK Biobank2,3和FinnGen,4促进了数万甚至数百万样本中大量性状的全基因组关联研究(GWAS)这些丰富的资源有助于确定许多遗传关联,并阐明复杂性状的遗传组成5、6利用分析结果,建立了基于基因组的预测模型,并成功地识别了具有高疾病风险的个体尽管取得了成功,但GWAS目前的一个主要限制是相对缺乏非欧洲样本。7由于欧洲人的罕见变异在其他祖先群体中可能具有较高的次要等位基因频率(MAF),因此缺乏非欧洲样本可能会限制进一步的发现。此外,如果在临床实践中使用遗传发现仅限于欧洲血统的个人,可能会导致8我们报告了来自韩国基因组和流行病学研究(KoGES)的72,298名韩国人的76种表型的GWAS以前使用KoGES数据进行了几次GWAS,包括用于人体测量特征和一些代谢物的GWAS。9最近,通过分析大量的表型,包括对日本生物银行(BBJ)12-14和台湾生物银行15数据的全表型分析,已经做出了重大努力来对东亚人的遗传关联进行通过增加东亚GWAS样本的样本量和人口多样性通过分析14个二元疾病终点、31个生物标志物、23个饮食信息和8个饮酒量表型,我们在全基因组显著性水平上鉴定了47种表型的2,242个相关基因座(P 53 10- 8)。为了充分利用KoGES数据中的信息,除了连续、二元和分类表型的混合效应模型外,我们还应用了最新的生存分析方法GWAS16和纳入家族病史的方法4,并确定了19个额外的显著相关性。在关联中,122例为新关联,在BBJ中,超过70%的具有相应表型和遗传变异的新许多新的基因座在欧洲人中具有非常低的MAF,这表明通过利用来自不同祖先群体的样本可以增加功率为了找到东亚特有的遗传关联,我们使用KoGES和BBJ(n = 251,000)GWAS结果对32个性状我们发现了25个性状的379个新基因座,大多数是临床生物标志物,其中85%的基因座在个体研究中未被发现我们还使用荟萃分析的GWAS摘要构建了多基因风险评分(PRS),并表明与仅从BBJGWAS训练的PRS相比,使用荟萃分析的KoGES和BBJ训练的PRS在预测UK Biobank中东亚样本的性状值时可以具有20%的R2,这表明我们的分析结果的一个潜在效用我们公开提供所有GWAS汇总统计数据,以扩大对东亚人群的遗传基础结果KoGESKoGES是韩国国家生物库的一部分,是一项前瞻性队列研究,CellGenomics 2,100189,October 12,2022 <$2022作者。1这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。会开放获取文章2Cell Genomics2,100189,2022图1. KoGES数据和我们的研究KoGES数据包括三个队列:基于社区的队列、城市队列和农村队列。KoGES的参与者是从国家健康考生登记处招募的,基线时年龄为R40图中的样本量表示存在基因型(QC后)和基线评估数据的样本数量参见表S1。测量和生物样本,如DNA,血清,血浆和尿液,收集了大约210,000人。KoGES包括以社区为基础的安山和安星研究、以城市社区为基础的健康受检者研究和以农村社区为基础的心血管疾病协会研究。每个队列都有基线评估和随后的随访测量,我们仅在本研究中使用基线测量(详见STAR方法)。图1中的表格按队列描述了KoGES数据的样本量和平均年龄。在我们的分析中使用了总共72,000个具有KoreanChip17基因分型和插补的样本(参见STAR方法)。GWAS的76我们的分析概述如图1所示,所研究的性状如表S1所示。我们分析了14个二元疾病终点,31个生物标志物,23个饮食信息和8个关于饮酒模式的特征。在我们的分析中使用了总共8,056,211个基因分型和插补的变体对于连续性状和二元性状,使用SAIGE18来最大化功效,同时控制I型错误。对于有序分类表型,我们应用比例优势logistic混合效应模型。19A47个性状的总共2,223个位点满足全基因组显著性阈值(p 5310- 8),其中使用5 Mb的窗口宽度和R2 = 0.1的连锁不平衡阈值鉴定显著聚集变异(表S2)。估计的错误发现率(FDR)为0.0017(FDR = 76 [性状的数量] 3106 [独立基因座的数量]35310- 8 [全基因组显著性阈值]/2,223 [显著基因座的数量]),其中假设100万个独立基因座对应于全基因组a= 5310- 8。20-我们进行了连锁不平衡评分回归(LDSC)24、25,以估计遗传力和遗传相关性(表S3)。所有76个性状的平均LDSC截距值均为1.0212,因此无显著混杂偏倚。遗传力最大的是身高(h2=0.400 ) , 其 次 是 体 重 ( h2= 0.270 ) 和 血 小 板 计 数 ( h2=0.265)。估计遗传力与UKBB和BBJ相似(h2分别为20.402和0.386)。我们还计算了成对的遗传相关性,以发现表型之间的遗传关系,Cell Genomics2,100189,2022年10月12日3会开放获取文章图2.遗传多效性分析结果在KoGES数据中,76个性状的Manhattan图,y轴为每个基因显著相关(
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Haskell编写的C-Minus编译器针对TM架构实现
- 水电模拟工具HydroElectric开发使用Matlab
- Vue与antd结合的后台管理系统分模块打包技术解析
- 微信小游戏开发新框架:SFramework_LayaAir
- AFO算法与GA/PSO在多式联运路径优化中的应用研究
- MapleLeaflet:Ruby中构建Leaflet.js地图的简易工具
- FontForge安装包下载指南
- 个人博客系统开发:设计、安全与管理功能解析
- SmartWiki-AmazeUI风格:自定义Markdown Wiki系统
- USB虚拟串口驱动助力刻字机高效运行
- 加拿大早期种子投资通用条款清单详解
- SSM与Layui结合的汽车租赁系统
- 探索混沌与精英引导结合的鲸鱼优化算法
- Scala教程详解:代码实例与实践操作指南
- Rails 4.0+ 资产管道集成 Handlebars.js 实例解析
- Python实现Spark计算矩阵向量的余弦相似度
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功