没有合适的资源?快使用搜索试试~ 我知道了~
资源HUNT研究:一项基于人群的遗传研究队列图形摘要亮点dTrøndelag健康研究(HUNT)是一项大型的、基于基因型人群的队列研究。d可获得近40年随访d国家个人识别号码整合了数字化的医疗保健信息dHUNT参与者的GWAS提供了对疾病作者本·MBrumpton, Sarah Graham ,IdaSurak ka,.,放大图片作者:BjJ. Willer通信ben. ntnu.no(B.M.B.),kristian.ntnu.no(K.H.),cristen@umich.edu(C.J.W.)简言之Brumpton等人介绍了Trøndelag健康研究(HUNT)的遗传队列概况,这是一项来自挪威Trøndelag县的大型基因分型人群队列。他们描述了非常丰富的特征,使其成为遗传研究的优秀群体。这些措施包括自1984年以来的重复调查数据他们展示了HUNT如何帮助理解人类特征和疾病的遗传贡献,并描述了未来的研究机会。Brumpton等人,2022,细胞基因组学2,1001932022年10月12日-作者。https://doi.org/10.1016/j.xgen.2022.100193会会~开放获取资源HUNT研究:一项基于人群的遗传研究队列本·M Brumpton,1,2,3,19,20,*Sarah Graham,4,19Ida Surakka,4,19Anne Heidi Skogholt,1Mari Løset,1,5LarsG.弗里奇,6布鲁克沃尔福德,7,8周伟,9,10乔纳斯比尔尼尔森,11奥德吉尔L。Holmen,1,2Maiken E.Gabrielsen,1,2Laurent Thomas,1,12,13,14Laxmi Bhatta,1Humaira Rasheed,1He Zhang,4Hyun Min Kang,6Whitney Hornsby,4玛尔塔·里瑟·莫克斯内斯,1号艾文德·科沃德,1号麦兹·梅尔拜,1号古罗·F。 Giskeødega Pirrd,1Jørn Fenstad,2Steinar Krokstad,2,14Marit Næss,2,15ArnulfLanghammer,2,15MichaelBoehnke,6GoncPiraloR. Abecasis,16BjørnOlavABesvold,1,2,17克里斯蒂安Hveem,1,2,19,*和克里斯汀J。Willer1,4,6,18,19,*1公斤捷成遗传流行病学中心,公共卫生和护理系,挪威科技大学,特隆赫姆7030,挪威2HUNT研究中心,公共卫生和护理系,挪威科技大学,Levanger 7600,挪威3挪威特隆赫姆7030特隆赫姆大学医院圣奥拉夫斯医院医学诊所4内科,心脏病学分部,密歇根大学,Ann Arbor,MI 48109,USA5挪威特隆赫姆特隆赫姆大学医院圣奥拉夫斯医院皮肤科整形外科、皮肤流变学和皮肤病诊所6美国密歇根大学生物统计学系和统计遗传学中心7计算医学和生物信息学系,Ann Arbor,MI,美国8美国密歇根大学公共卫生学院统计遗传学中心9美国马萨诸塞州波士顿市马萨诸塞州总医院医学系分析和转化遗传学单位10斯坦利精神病学研究中心,麻省理工学院和哈佛大学布罗德研究所,美国马萨诸塞州11丹麦哥本哈根Statens血清研究所流行病学研究部12挪威科技大学临床与分子医学系,挪威13挪威科技大学生物核心-生物信息学核心设施,挪威14挪威特隆赫姆特隆赫姆大学医院圣奥拉夫斯医院检验科诊所15Levanger Hospital,Nord-Trøndelag Hospital Trust,Levanger,挪威16Regeneron Genetics Center,Tarrytown,NY 10591,USA17挪威特隆赫姆7030特隆赫姆大学医院圣奥拉夫斯医院内科诊所内分泌科18美国密歇根大学人类遗传学系,美国19.作者贡献相等20引线触点* 通信:ben. ntnu.no(B.M.B.),kristian. ntnu.no(K.H.),cristen@umich.edu(C.J.W.)https://doi.org/10.1016/j.xgen.2022.100193总结特伦德拉格健康研究(Hunt)是一项基于人口的队列研究,从1984年开始在挪威特伦德拉格县分四波招募了229,000人这些个体中约有88,000人具有来自阵列基因分型的可用遗传数据。HUNT参与者在四个以社区为基础的招募波中招募,并提供有关健康相关行为,自我报告诊断,疾病家族史的信息,并接受体检。通过挪威个人身份证号码建立的联系将来自医生就诊和国家健康登记册(包括死亡、癌症和处方登记册)的数字化保健信息HUNT参与者的全基因组关联研究为心血管、代谢、代谢性疾病和肝脏相关疾病等的机制提供了见解。该队列的独特特征有利于研究,包括在积极和受过良好教育的人群中进行近40年的纵向随访,家庭数据,全面的表型分析,以及广泛的DNA,RNA,尿液,粪便,血浆和血清样本。介绍与其他北欧国家一样,挪威具有独特的特点,有利于招募人群研究、建立生物库以及确定临床结局和疾病轨迹。这包括一个独特的个人身份证明在整个生命周期中应用的数字,一个普遍和数字化的公共卫生保健系统,以及可访问的统一电子健康记录。此外,17个强制性和有效的国家卫生登记处用于健康分析、管理和应急准备,52个国家医疗质量登记处提供疾病特异性数据,CellGenomics 2,100193,October 12,2022 <$2022作者。1这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。会开放获取资源2Cell Genomics2,100193,2022图1.特伦德拉格健康研究(HUNT),特伦德拉格,挪威特伦德拉格县是淡蓝色阴影,橙色点表示在Levanger的HUNT研究中心的位置。诊断和治疗参数。最后,挪威人是一个利他主义的,高度积极参与生物医学研究的人口,这反映在调查答复率高达89%。这些因素支持了Trøndelag健康研究(HUNT)的建立和维护,这是一项基于人群的大型前瞻性挪威队列研究,与可追溯到40多年前的注册表和生物库相关(图1)。为了了解疾病的遗传基础,以及在挪威一个已确定的县跟踪具有遗传和流行病学风险因素的个体,我们于2005年在挪威科技大学和美国密歇根大学的HUNT研究之间建立了全面合作(见数据S1)。本文通过描述研究人群、HUNT中结合基因分型、测序和基于插补的方法的策略、几十年来HUNT研究人员收集的大量表型数据、与数字化公共卫生保健系统的联系以及关键技术,介绍了这种合作的历史和现状。迄今为止的发现。研究人群HUNT是挪威特伦德拉格县正在进行的一项基于人群的健康研究。本研究收集了该地理区域内个体的问卷调查、访谈和临床检查的健康相关数据(图2)。迄今为止,超过229,000名成年人(招募时20岁或以上)参与了研究,其中95,000人提供了至少 一份生物 样本( https://www.ntnu.edu/hunt/hunt-samples)。1-4定期调查设计包括四个征聘波。HUNT 1(1984- 1986)、HUNT2(1995-1997)、HUNT3(2006-2008)和HUNT4(2017-2019)主要集中在北特伦德拉格地区,所有成年人(年龄R20岁)都被邀请。此外,HUNT4扩展到收集来自南特伦德拉格成年人口的基本问卷数据(105,797名额外参与者)。3大约19,000名成年人参加了所有四次HUNT波,因此拥有跨越35年的纵向问卷和体检作为对成人参与者调查的补充,四单独杨亨特收集的调查数据来自约25,000名初中和高中青少年与HUNT 2 -4同时进行未进行基因分型然而,有4,212人相继参加了成人版的HUNT。HUNT研究的参与率很高(在受邀者中,两次调查的参与率从54%到89%HUNT和Young-HUNT队列在其他地方有更详细的描述。1-5HUNT中的基因分型和插补研究设计在至少一个HUNT招募期内,约有88,000人为医学研究提供了DNA。最初,我们的努力集中在识别与心肌梗死(MI)相关的遗传变异。6-尽管未发现新的显著关联(可能是由于样本量有限),但这组低通序列为挪威人群中存在的遗传变异提供了重要见解,并为单倍型参考联盟(HRC)插补小组提供了挪威参考序列。9接下来,我们对所有具有可用DNA的HUNT 2 -3参与者(n = 70,517)完成了全基因组基因分型(图3)。出于捕获高质量、常见和低频以及诺氏特异性变体的目标,我们使用了多种方法来观察或估计基因型:(1)使用来自Illumina的标准和定制的HumanCoreExome阵列进行直接基因分型(2)用合并的HRC和HUNT-WGS插补组进行基因分型和插补;和( 3 ) 用 TOPMed 插 补 组 进 行 插 补 ( 图 4 ) 。 在 用 标 准HumanCoreExome阵列(HumanCoreExome 12 v1.0和v1.1)对 12 , 864 例 样 本 进 行 基 因 分 型 后 , 我 们 使 用 定 制 的HumanCoreExome阵列(UM HUNT Bio-bank v1.0)对剩余样本进行基因分型,其中包括在HUNT-WGS中观察到的蛋白质改变变体。我们遵循了严格的质量控制协议的基础上开发的方法,郭等。这包括排除未能达到99%调用率的样本和变体,导致358,964个多态性变体的基因分我们接下来使用2,201个测序样品(HUNT-WGS)与HRC小组进行联合插补。9我们之前表明,与单独使用1000个基因组或HRC参考面板相比,使用HUNT特异性参考面板的插补改善了低频和群体特异性变异的插补。11最后,我们从TOPMed插补组中插补了2500万个变异(次要等位基因计数大于10),与人群特异性参考组相比,插补质量略低,但捕获了更多的变异(图S1)。这两个归咎于数据集可以分开使用下游Cell Genomics2,100193,2022年10月12日3会开放获取资源图2. HUNT 1 -4调查的样本量以及关键数据和生物样本的详细信息DNA,脱氧核糖核酸; HUNT,特伦德拉格健康研究; RNA,核糖核酸。分析;我们建议使用HRC和HUNT-WGS impu- tation的挪威特定的变体的调查。总之,插补导致来自HUNT 2或HUNT 3的70,517个个体中的3300万个变异,其中330万个变异在英国生物库中未发现。最后,来自HUNT 4的18,721个新样本最近使用相同的方法进行了基因分型(人类核心外显子组阵列,UM HUNTBio-bank v2.0),随后的插补将创建一个新的,更大的数据冻结约88,000个来自HUNT 2 -4的个体进一步详情关于HUNT中的质量控制和插补,请参见STAR方法。表型基于实验室检查、临床检查和自我报告的问卷调查,HUNT参与者可获得广泛的表型这些包括非空腹血脂和血糖特征;一系列疾病的病史(包括诊断年龄),包括心血管事件;基本人口统计学,包括性别和参与年龄;人体测量学,包括体重、身高、BMI和腰臀比;血压测量;生活方式信息,包括吸烟状况(表1)。HUNT数 据 类 别 已 在 前 面 描 述 过 , 2 、 3 并 在 HUNT 数 据 库 网 站(https://www.ntnu.edu/hunt/databank)上详细描述。为了确保数据的高质量,生物材料在野外工作站根据适当的标准进行处理,每天晚上通过冷链运输到生物库。将几项测量结果(包括血红蛋白和血细胞计数、肌酐和胆固醇)送去立即分析,由经过专门培训的人员根据相同的标准化方案使用相同的设备进行分析。血浆、血清和血沉棕黄层以等分试样储存在自动化储存器中。在-80°C的冷冻库中。数据库网站更详细地介绍了每项措施,包括具体细节使用的仪器和变异系数(https://www.ntnu.edu/hunt/databank)上提供。重要的是,在HUNT 调查中,许多测量和问卷项目有意保持相同或相似,以进行纵向分析,这可能有助于了解疾病进展和生存率。与区域和国家卫生登记册的联系HUNT参与者同意与挪威许多高质量的卫生和行政登记处以及医疗记录中的信息相联系。使用发给所有挪威公民的唯一个人身份号码,可以通过HUNT数据、区域和国家登记册以及电子健康记录之间的联系进行纵向跟踪。挪威目前有17个国家卫生登记处(https://helsedata.no/no/),这些登记处是强制性的,覆盖整个人口(表S2)。与HUNT相关的常用国家登记处包括挪威死因登记处(1951年建立)、挪威癌症登记处(1952年建立)、挪威医学出生登记处(1967年建立)、挪威处方数据库(2004年建立)、挪威疾病控制和健康报销支付数据库(2006年建立)和挪威初级卫生保健登记处另有52个国家疾病特异性医疗质量登记处保存了个人层面治疗和反应的详细信息(https://www.kvalitetsregistre.no/registeroversikt)(表S2)。当地医院的电子健康记录保存了1987年的国际疾病和相关健康问题统计分类(ICD)代码。与行政登记册的潜在联系扩大了数据资源,其中包括挪威统计局,记录个人和家庭的收入和财富统计,以及挪威武装部队卫生登记册(https://helsedata.no)。总之,列出的登记研究提供了整合来自多个时间点的广泛数据以获得高质量表型的4Cell Genomics2,100193,2022会开放获取资源图3.从不同HUNT调查中获得的HUNT基因型样本(n = 88,615)Hunt,Trøndelag健康研究。以及关于例如环境和社会经济因素的相关信息。时间戳数据允许研究疾病的发展和进展,例如冠状动脉疾病的风险预测。12一些选定的疾病终点见表2。相关样品的分析方法大多数HUNT参与者都是挪威血统。4使用人类基因组多样性项目中的祖先主成分,由于能力有限,我们通常排除非欧洲祖先的样本(2%)(图S2)。我们已经观察到,在北特伦德拉格和南特伦德拉格之间,以及在靠近海岸和瑞典边境[13]此外,由于对挪威一个县(Trønde-lag)的高确定性,队列中有许多相关个体。在88,615名HUNT 2 -4参与者中,共有79,551人(89%)至少有一名二级或近亲属也参加了HUNT(图S3;表S3)。一方面,数据集中参与者的高度相关性在HUNT中使用大家族和遗传数据的早期努力是分析罕见的编码变异,14当样本量有限且仅鉴定出所有性状相关变异的一小部分时,家族样本可以提供更大的检测关联的能力14在此之前,已经开发了一些方法来解释数量性状分析的相关性,15但缺乏适当解释相关性和控制二元性状不平衡病例对照比的方法。因此,我们开发了统计方法,以允许对所有个体进行分析,并控制二元表型的病例对照不平衡,这在生物库(如HUNT)中常见。这些方法在生物库规模的数据中计算效率很高,使我们能够在HUNT中对单个变异(使用SAIGE)和基于基因的变异进行关联测试。负担测试(使用SAIGE-GENE),同时通过状态共享标记说明样本与稀疏相同的相关性。14,16-18这些方法通过使用鞍点近似来校准基于逻辑混合模型的评分检验中不平衡的病例对照比,解释了二元表型的病例对照不平衡,这在基于人群的样本中是典型的。[14]我们在HUNT中使用SAIGE分析不平衡病例对照比时,在降低I型错误率例如,静脉血栓栓塞,有2,325例病例和65,294例对照,病例对照比为0.036,在SAIGE开发之前可用的方法中有大量的I型错误膨胀(图S4)。为了证明SAIGE-GENE的应用,我们研究了13,416个基因,其中至少有2个罕见(MAF %1%)错义和/或停止增益变体,这些基因直接从HRC和HUNT-WGS联合参考组中进行基因分型或插补,其中69,716个来自HUNT 2 -3的挪威样本具有测量的高密度脂蛋白。我们确定了8个具有p值的低于外显子组范围的显著性阈值(p % 2.5± 10- 6),其中7个在调整了附近的单变异关联,表明这些基因内独立的罕见编码变异。17重要的是,使用SAIGE和SAIGE-GENE,我们能够使用所有样本,解释样本相关性病例对照不平衡,并保持良好控制的I型错误率。使用相关样本的传统方法是连锁分析,然而,在全基因组遗传学时代,这具有计算挑战。为了允许在具有数百万个遗传标记的数据集中进行连锁测试,已经开发了更快且计算上弹出链接。19《群体连锁》使用Haseman-Elston回归(最初用于同胞对连锁分析)来估计成对关系的方差分量和血统估计的同一性。使用HUNT数据,Zajac等人在4个性状(高密度脂蛋白、低密度脂蛋白、总胆固醇和甘油三酯)的19个不同基因座上观察到LOD > 3的25个显著连锁峰,其中LOD > 3的5个峰在HUNT中359,432个基因分型变体的全基因组关联研究(GWAS)中没有在全基因组显著性上重复。19然而,在用HRC和HUNT-WGS参考组对数据集进行插补以覆盖全球脂质遗传学联盟中的更多变体或荟萃分析后,观察到所有五个连锁峰的显著关联。本研究证明了连锁分析优于GWAS的优势之一,即能够检测难以基因分型的区域中的连锁,例如罕见变异、结构变异、拷贝数变异或高度重复区域中的变异,只要可以鉴定该区域中的相同血统区段[19]最后,当研究在家族内分离的罕见风险变异时,连锁分析可以提高统计功效,HUNT研究参与者的高度相关性这些包括GWAS通过代理,20,21其中表型基因分型的HUNT参与者的非基因分型家族成员可用于鉴定代理病例,即具有病例遗传风险比例(一级亲属为0.5)的个体Cell Genomics2,100193,2022年10月12日5会开放获取资源B图4.HUNT中基于基因分型和插补的方法(A) 方法流程图。(B) 每种方法捕获的变体数量HUNT,Trøndelag健康研究; HRC,单倍型参考联盟; k,千; M,百万; TOPMed,用于精准医学的跨组学; WGS,全基因组测序。*并非所有基因分型阵列都包含定制内容。在HRC成立时,只有1,200个HUNT样本被测序;然而,2,201个样本被纳入HRC + HUNT WGS小组。这些代理案例可以被适当地建模以增加GWAS中的统计功效例如,检测的能力当代理病例适当建模而不是用作标准对照时,优势比为1.1,MAF为0.21,α为53 10- 8的等位基因从0.419增加到0.644。GWAS(图S5A)。我们还展示了HUNT中TCF7L2中已知的2型糖尿病变体rs7903146的经验结果(图S5B)。结果来自Hunt的基因发现HUNT队列中丰富的表型和遗传数据导致在广泛的性状中发现了许多新的遗传关联(表3)。HUNT参与者的早期遗传研究使用外显子组阵列,并专注于心血管疾病。我们在TM6SF2中鉴定了一种与总胆固醇、MI和肝酶6相关的新的编码变体,并在9p21位点复制了已知的MI相关性和LPA基因中的一种低频错义变体(p.Ile1891Met )。 7在对近 70,000名参与者在 HUNT 2和HUNT 3中进行基因分型以及开发组合HRC和HUNT-WGS插补参考组之后,我们将我们的分析扩展到全基因组搜索。通过植入来自低通HUNT-WGS的indel,我们发现了MEPE基因中的一种罕见突变,该突变在挪威人群中富集(HUNT中0.8%,非芬兰欧洲人中0.1%),该突变与前臂骨矿物质密度低以及骨质疏松症和骨折风险增加相关。22尽管该区域先前已被确定为与骨矿物质密度相关,23但通过确定可能导致蛋白质功能丧失的插入/缺失多态性,HUNT与英国生物库中复制的关联24将MEPE确定为该区域中在另一项研究中,我们特别关注了与有利的血脂谱(降低LDL胆固醇和降低CAD风险),与肝酶改变或肝损伤无关。我们还发现了一个老年人的纯合ZNF 529功能丧失变异体没有心血管疾病或糖尿病的迹象,这表明该基因的完全敲除是可行的。这突出了ZNF 529作为从测序和定制内容基因分型鉴定的脂质25除了仅使用HUNT数据进行的关联研究之外,我们还为许多旨在汇总跨队列GWAS数据的通过进行包括HUNT和其他队列的GWAS荟萃分析,我们的研究团队的努力已经确定了与房颤相关的遗传变异,这些变异可能通过胎儿心脏发育29和心脏结构重塑30期间受损的肌肉细胞分化和组织形成机制发挥作用;与估计的肾小球滤过率相关的变异表现出性别特异性效应27,37;与促甲状腺激素 相关 的变异 揭示 了TSH 水平 与甲 状腺癌 之间 的 26使用TOPMed参考组的后续研究38鉴定了与循环心肌肌钙蛋白I水平相关的变体,使用孟德尔随机化研究了其作为MI的非因果生物标志物的作用,31并鉴定了与铁相关生物标志物水平相关的变体,并探索了其与全因死亡率的关系。32因果推理和家庭效应HUNT研究中的高度相关性为使用基于家族的设计来调查因果关系提供了一个独特的机会。孟德尔随机化(MR),它使用遗传变异作为工具变量来研究可修改的(非遗传)因素,首先提出使用父母-后代设计。39从每个亲本遗传的等位基因在减数分裂过程中随机确定。这种随机分配对于在MR研究中提供可靠的比较然而,由于缺乏基因型一6Cell Genomics2,100193,2022会开放获取资源~教育(%)表1.HUNT 1 -4临床检查所有参与者(N = 123,219)和基因分型参与者(N = 88,615)的HUNT队列人口统计学资料所有(HUNT 1 -4)基因分型(HUNT 2 -4)N总男性女性N总男性女性人数(%)123,21959 121人(48%)64 098人(52%)88,61541 482人(47%)47 133人(53%)初次就诊年龄,123,21943.8 ±17.743.8 ±17.343.9 ±18.088,56639.1 ±14.039.2 ±13.839.0 ±14.1年龄(范围18平均值±标准差)a最后一次上学的年龄,年龄b(范围18123,21956.5 ±19.156.1 ±18.756.8 ±19.588,56655.9 ±18.655.9 ±18.255.8 ±18.9平均值±SD)随访时间,年123,17722.4 ±12.822.2 ±12.922.5 ±12.788,54824.1 ±12.424.2 ±12.424.0 ±12.5定量测量(平均值±标准差)b体重指数,kg/m2119,88826.8 ±4.626.9 ±4.126.8 ±5.188,34527.2 ±4.727.3 ±4.127.0 ±5.1SBPc,mm Hg120,448136.8 ±23.7138 ±21.2135 ±25.688,420133 ±21.3135 ±19.2131 ±22.8LDL-Ce,mg/dL93,8353.4 ±1.13.3 ±1.13.4 ±1.187,1633.3 ±1.13.3 ±13.4 ±1.1肌酐,mmol/L95,36180.3 ±2288.9 ±22.772.7 ±18.388,52779.6 ±22.088.3 ±22.972.0 ±18.0葡萄糖f,mmol/L78,4295.6 ±1.75.7 ±1.85.5 ±1.671,7905.6 ±1.75.7 ±1.85.5 ±1.6促甲状腺71,2131.4 ±1.51.5 ±1.51.4 ±1.670,5411.4 ±1.51.5 ±1.51.4 ±1.6激素,mIU/L血血红蛋白,g/dL54,34714.6 ±1.315.4 ±1.214.0 ±1.051,89231 ±1.731.1 ±1.630.8 ±1.8FEV118,8543.1 ±1.03.6 ±1.12.7 ±0.817,6873.1 ±1.03.6 ±1.12.7 ±0.8全髋T评分HUNT 3g11,4350.1 ±0.9–0.1 ±0.2 ±0.911,2810.1 ±0.9–0.1 ±0.2 ±0.9社会经济状况(N,%)d小学39,208 36.1% 17,473(33.7%)21,735(38.3%)21,235 25.7% 8,801(22.9%)12,434(28.3%)高中42,253 38.8% 22,511(43.3%)19,742(34.7%)36,439 44.2% 19,160(49.8%)17 279人(39.3%)大学/学院(4年以下)14,765 13.6% 6,819(13.1%)7,946(14.0%)13,282 16.1% 6,044(15.7%)7,238(16.4%)学院/大学(4年或以上)12,565 11.5%5,161(9.9%)7,404(13.0%)11,515 14.0%4,491(11.6%)7,024(16.0%)家庭收入,%<250,000挪威克朗5,620 10.4% 1,777(7.1%)3,843(13.1%)5,356 10.2% 1,665(6.9%)3,691(12.9%)250,000NOK11,736 21.6% 5,139(20.6%)6,597(22.6%)11,447 21.7% 4,990(20.6%)6,457(22.6%)451 000NOK15,751 29.1%7,666(30.7%)8,085(27.6%)15,36229.1%7,453人(30.8%)7,909人(27.7%)75.1万NOK11,521 21.3% 5,500(22.1%)6,021(20.6%)11,260 21.4% 5,360(22.2%)5,900(20.7%)> 1,000,000挪威克朗9,564 17.6% 4,863(19.5%)4,701(16.1%)9,307 17.6% 4,716(19.5%)4,591(16.1%)FEV 1,第一秒用力呼气量;HUNT,Trøndelag健康研究; BMI,体重指数; SBP,收缩压; LDL-C,低密度脂蛋白胆固醇; SD,标准差; NOK,挪威克朗。a据报告,HUNT首次出席。b报告HUNT最后一次出勤情况cHUNT 1中第一次和第二次测量的平均值以及HUNT 2、-3和-4中第二次和第三次测量的平均值。d在HUNT自我报告的教育和家庭收入。e采用Friedewald方程估计LDL-C。f非空腹血糖。来自HUNT 4的约70%的参与者还测量了全髋关节的BMD,这些BMD正在进行质量控制。家族数据,以前的研究在群体水平上应用MR,其中等位基因的随机分配仅是近似的我们能够使用HUNT中的15,000个系列来执行最初提出的基于系列设计的MR。33使用这个在HUNT的方法中,我们从经验上表明,从无关个体样本中估计的较高身高和较低BMI增加教育程度的相关性的MR估计值可能是由人口结构、选择性交配或GCell Genomics2,100193,2022年10月12日7会开放获取资源表2. 1987年至2021年本地医院登记册中选定疾病的ICD代码和基因分型HUNT参与者ICD章节ICD-9ICD-10基因分型病例传染病和寄生虫病COVID-19,病毒鉴定U07.166COVID-19个人病史U084COVID-19后状况U0911肿瘤直肠乙状结肠恶性肿瘤直肠、肛门和肛管连接处一百五十三,一百五十四C18、C19、C20、C212,455支气管和肺162C341,585皮肤恶性黑素瘤172C431,304的乳房一百七十四,一百七十五C502,144的前列腺185C612,721内分泌、营养和代谢疾病甲减240,241,242,243,244,245E00、E01、E02、E034,2692型糖尿病250E117,350精神和行为障碍痴呆二九零二九四三百三十一F00、F01、F02、F03、G30、G31.14,431情绪(情感)障碍二九六、二九八、三百、三百零一、三百一十一F30、F31、F32、F33、F34、F38、F399,735神经系统帕金森病三百三十二,三百三十三G20、G21、G22、F02.31,177癫痫345G402,296偏头痛346G432,758眼睛和附件疾病青光眼365H405,610循环系统原发性高血压401I1020,031心绞痛413.9I207,660急性心肌梗死410I217,005房颤和房扑427I4810,232心力衰竭428I50、I09、I117,117脑出血四三一四三二I611,082主动脉瘤和夹层441I712,090呼吸系统慢性阻塞性肺疾病496J44.8、J44.95,188哮喘493J455,636炎症后肺纤维化515J84.1、J84.8296消化系统克罗恩病555K50772溃疡性结肠炎556K511,971乳糜泻579K90.01,088皮肤和皮下组织特应性皮炎691.8L201,134银屑病696L402,782肌肉骨骼系统和结缔组织痛风274M101,694强直性脊柱炎720M451,666泌尿生殖系统慢性肾病585N183,464(接下页)8Cell Genomics2,100193,2022会开放获取资源表2. 继续ICD章节ICD-9ICD-10基因分型病例怀孕、分娩和产褥期妊娠期高血压342O13609处方数据a小剂量阿司匹林––22,500他汀––2,200数字来自Nord-Trøndelag医院信托基金的数据查询(2021年8月8日),包括St.Olavs、Namsos和Levanger医院的患者从HUNT 2 -4中选择用于基因分型登记册正在进行中,因此案件数量随着时间的推移继续增加基于医院数据的数字可能会导致对不太严重的常见疾病的不确定性。HUNT,Trøndelag健康研究; ICD,国际疾病和相关健康问题统计分类。a来自处方登记册的近似数字,仅限于在HUNT 2 -3中基因分型的那些。王朝效应我们在HUNT或23andMe的222,368名同胞的重复队列中的家族内MR分析中未观察到明确的相关性。[33]此后,这种方法越来越受欢迎,与HUNT一起,许多队列现在有助于调查基于家族的设计的因果关系。34进一步利用HUNT中的家族结构信息,我们已经执行并且将来有机会调查家族成员之间的因果效应,例如父母-后代效应40、41以及选择性交配和兄弟姐妹效应。42由于缺乏基因型家族数据,这些研究设计以前是不可能的,这限制了因果推理(如上所述)和典型GWAS区分直接和间接遗传效应的能力。34HUNT数据允许研究设计解开人类基因型-表型关联的这些来源。在一个这样的例子中,我们使用了26,057对母亲-后代和9,792对父亲-后代来研究子宫内的不良环境因素是否会增加后代未来患心脏代谢疾病的风险。我们观察到,不利的母体宫内环境,作为代理的母体SNP,影响后代出生体重,不太可能是一个主要的决定因素,晚年的心脏代谢结果的后代。40对合作研究的虽然HUNT研究是迄今为止提到的遗传发现和因果推断中的重要队列,但由于研究不常见表型的能力较低、研究结果对非欧洲人的可推广性不确定以及缺乏独立样本进行复制,因此孤立使用该为了克服这些局限性,我们通过参与专注于各种疾病的联盟,为全球的遗传研究做出贡献,这些疾病包括心血管疾病、43、44脂质、45、462型糖尿病、47骨质疏松症、48肾功能下降、49阿尔茨海默55我们还将HUNT数据贡献给人体测量特征的研究,56酒精和尼古丁的使用,57,58COVID-19,59全表型发现,60和遗传风险预测,12等等。这些贡献突出了来自K.G.的同等部分的研究人员的努力。挪威NTNU的Jebsen遗传流行病学中心,密歇根大学医学院,和美国密歇根大学公共卫生学院。我们相信,60个联盟的团队科学实现了HUNT研究的目标,并使科学以最快的速度走向新的发现和改善人类健康。讨论该研究如上所述,HUNT研究主要包括欧洲血统的个人此外,研究罕见表型受样本量限制。此外,虽然所有R20岁的居民都被邀请参加HUNT,但并非所有参与者都有生物样本,这可能限制了普遍性。然而,与其他研究相比,HUNT的参与水平相对较高,表明对选择偏差的关注程度较低。总结总之,在HUNT中,多方面的遗传发现策略(包括基因分型、测序和基于估算的方法)有助于识别疾病和人类特征的可能致病基因和变体。它也被证明是一个宝贵的资源,遗传知情的因果推理方法,支持识别可修改的风险因素。我们将这一成功归功于特伦德拉格人民的意愿和高参与率,几十年来HUNT研究人员收集的大量表型,以及数字化公共卫生保健系统的使用。我们希望,诸如此类的捕获人群特异性变异的举措,使用长达40年的现有纵向生物医学研究数据,并且大多数成年居民参与其中,能够有力地说明为什么在挪威和广泛的人群中拥有遗传数据是重要的我们认为,丰富的数据收集将继续成为未来纵向和基于家族的设计、遗传发现、孟德尔随机化、Meta分析和多基因评分验证的独特数据集。STAR+方法本文件的在线版本提供了详细的方法,包括以下内容:d关键资源表Cell Genomics2,100193,2022年10月12日9会开放获取资源表3.通过HUNT基因分型和分析策略的遗传发现战略频率范围/变量数量好处典型论文使用定制外显子组进行罕见常见/80,137-识别低频变体确定可能的致病基因,内容由Hunt顺序样品358,964不容易归责-型方针TM6SF2,与TC军情六处HUNT生物样本库阵列)在ZNF 529导致LDL-C降低25HRC和HUNT-WGSlow–common/22包括针对具体人群群体富集变异人体插补核心外显子组阵列通过改进归责MEPE精确定位致病基因骨折风险22已识别的变异相关甲状腺功能26例,肾功能27例,血清PCSK9、28和房颤29,30TOPM插补low–common/25扩大可用已识别的变异相关人类核心外显子组阵列关联测试肌钙蛋白和血清铁in the general一般population人口31,32以家庭为基础的设计,超过15,000对兄弟姐妹,任何/10- 1,000改进效应量估计和未研究引入了新的分析方法,包括SAIGE,16个家族内> 35,000名父母子女亲属孟德尔随机化,以及GWAS GWAS33,34孟德尔随机化任何/10- 1,000确定因果关系,探讨了脂质的作用,环境因素(基因决定的特征)和结果载脂蛋白对肾功能的影响35,36证明了一个相反的甲状腺与甲状腺功能之间的关系刺激素和甲状腺癌26注:罕见变异1%次要等位基因频率(MAF);低频变异,1%-5% MAF;常见变异,>5% MAF。HUNT,Trøndelag健康研究; HRC,单倍型参考联盟;LDL-C,低密度脂蛋白胆固醇; LOF,功能丧失; MI,心肌梗死; TC,总胆固醇; TOPMed,用于精密医学的Trans-Omics; UM,密歇根大学; WGS,全基因组测序。d资源可用性B电极导线触点B材料供应情况B数据和代码可用性d实验模型和子系统d方法样本B基因分型阵列设计B基因分型程序B插补补充信息补 充 信 息 可 以 在 www.example.com 上 找 到 https://doi.org/10.1016/j 。xgen.2022.100193。致谢特伦德拉格健康研究(HUNT)是HUNT研究中心(挪威科技大学医学与健康科学HUNT中的基因分型由国立卫生研究院资助;密歇根大学;挪威研究委员会;挪威中部教育,研究和创新联络委员会;以及St Olavs医院与NTNU医学和健康科学学院之间的联合研究委员会。遗传学研究HUNT研究是K.G. NTNU的Jebsen遗传流行病学中心、密歇根大学医学院和密歇根大学公共卫生学院。KG捷成遗传流行病学中心由挪威NTNU医学与健康科学学院的Stiftelsen Kristian Gerhard Jebsen资助我们感谢HUNT参与者贡献他们的时间,样本和信息来帮助他人;感谢Nord-Trøndelag医院信托基金的临床医生和其他员工的支持和对数据收集的贡献;感谢Trøndelag县议会,JonOlav Sliper创建图1;感谢K.G.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功