没有合适的资源?快使用搜索试试~ 我知道了~
资源Taiwan Biobank:台湾人口的丰富生物医学研究数据库图形摘要亮点d台湾生物样本库(TWB)是一项前瞻性人群研究,> 150,000人D 在汉族人群中收集了丰富的表型和遗传数据,中国人群d未来与国家卫生登记处的联系将使纵向遗传研究更加dTWB研究有助于全球遗传学研究作者冯燕珍,陈家燕,陈姿婷,...,天歌:黄海亮,林艳峰对应ajfeng@ntu.edu.tw(Y.- C.A.F.),yflin@nhri.edu.tw(Y.-(F.L.)简言之峰等人描述了台湾令人印象深刻的生物医学资源,该资源测量了> 150,000个个体的广泛这一资源使大规模的流行病学和遗传学调查成为可能,并丰富了人类基因组研究中的人口多样性。Feng等人,2022,细胞基因组学2,1001972022年11月9日-作者。https://doi.org/10.1016/j.xgen.2022.100197会会开放获取资源台湾生物样本库:丰富的台湾人口生物医学研究数据库1,22,*陈佳燕,2陈子婷,3郭柏秀,1,4徐怡祥,5,6,7,8杨怀义,9,10,11,12陈伟杰,1,3,4苏铭伟,13朱厚伟,13沈晨阳,1,4,15葛田,16,17黄海亮,16,18,19和Yen-Feng Lin3,20,21,*1国立台湾大学公共卫生学院流行病学与预防医学研究所,台北,台湾2Biogen,Cambridge,MA,美国3国立卫生研究院神经精神病学研究中心,苗栗,台湾4国立台湾大学医学院精神病学系,台北,台湾5马库斯老龄研究所和哈佛医学院,波士顿,MA美国6美国马萨诸塞州波士顿贝斯以色列女执事医疗中心7美国马萨诸塞州波士顿哈佛大学公共卫生学院8美国马萨诸塞州剑桥麻省理工学院和哈佛大学布罗德研究所9中央研究院基因组研究中心,台北,台湾10台湾台北国立阳明大学临床医学研究所11高雄医学大学医学院医学研究所,台湾12中央研究院生物医学翻译研究中心,台北,台湾13台湾生物库,中央研究院,台北,台湾14台湾台北中央研究院生医研究所15中国医科大学环境科学研究所,台湾台中16美国麻省理工学院和哈佛大学布罗德研究所斯坦利精神病学研究中心,马萨诸塞州剑桥17美国马萨诸塞州波士顿麻省总医院基因组医学中心18分析和转化遗传学单位,马萨诸塞州总医院,波士顿,MA,美国19美国马萨诸塞州波士顿哈佛医学院医学系20国立阳明交通大学医学院公共卫生医学人文学系,台湾21国立成功大学医学院行为医学研究所,台南,台湾22引线触点* 通信:ajfeng@ntu.edu.tw(Y.- C.A.F.),yflin@nhri.edu.tw(Y.-(F.L.)https://doi.org/10.1016/j.xgen.2022.100197总结台湾生物银行(TWB)是一项正在进行的前瞻性研究,研究对象为台湾20-70岁的150,000人通过结构化访谈和身体测量,在招募和随访访视时收集每位知情参与者的表型综合列表从血液和尿液样本中生成生物标志物和遗传数据我们在这里提出的TWB的遗传数据质量,人口结构和家庭关系,其中主要包括汉族血统的概述与台湾国民健康保险数据库(>25年)和其他登记处的链接TWB为东亚的生物医学和公共卫生研究提供了最大的生物库资源之一,通过与其他生物库的合作研究,将有助于我们了解全球人群健康和疾病的遗传基础介绍台湾位于东亚,是一个36,000平方公里的岛屿,人口2,300万,公共卫生基础设施完善。为了推进流行病学和生物医学研究,台湾于2012年推出了自己的生物库-台湾生物库(TWB),该生物库前瞻性地收集了各种生活方式行为,环境风险因素以及常见复杂疾病的家族史。台湾人口和测量的遗传信息的生物库参与者。TWB的一个强大方面是能够将生物库受试者与台湾自己的健康保险数据库和其他纵向登记处联系起来在全球生物库荟萃分析倡议(GBMI)的旗舰论文中,我们在这里提供了东亚(EAS)遗传学研究的TWB资源的详细描述,CellGenomics 2,100197,November 9,2022 <$2022作者。1这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。会开放获取资源2细胞基因组学2,100197,2022一B图1.湾仔绕道的设计及人口统计(A) TWB在台湾招募中心招募20-70岁的男性和女性目前的版本包括30-70岁的个人通过结构化访谈、体格检查和血液/尿液检测,在基线时收集每位参与者的表型,并在首次访视后2-4年进行重复测量截至2021年8月,在所有15万名参与者中,有37,508人完成了第一轮随访生成所有参与者或参与者子集的多组学数据,包括阵列基因分型、WGS、HLA分型、DNA甲基化和血液代谢组(也参见表S1目前正在与NHIRD和其他健康相关登记处建立联系,以提供TWB自我报告以外的表型信息。预计将继续招生,直到达到200 000名志愿者的目标。(B) 基线时研究参与者的年龄、性别和教育水平分布。参加TWB的女性人数多于男性。参与者的年龄平均分布在每个10岁年龄段。大学学历的人在目前的人群中所占比例最大超越。与以往文献中对TWB数据的具体分析不同,本文从队列设计、表型可用性、基因组数据生成、样本特征、遗传学发现以及数据访问和共享政策等方面对TWB进行了综述。结果湾仔绕道概览台湾生物样本库(TWB)是一项政府支持的前瞻性队列研究,收 集 了 台 湾 人 群 的 广 泛 表 型 测 量 和 基 因 组 数 据(https://www.twbiobank.org.tw)。TWB于2012年开始,目标样本量为20万人,采用基于社区的方法,从30多个招募点招募了20-70岁的男性和女性台湾,按各县市人口密度分布。招募时,参与者提供书面知情同意书,并通过问卷调查、体格检查以及血液和尿液检查收集其基线数据(图1A;表S1)。从2016年开始,在预期计划的访视中重复测量这些表型,平均在首次访视后2-4年内在随访期间,参与者还将接受医学成像检查,如超声波和心电图扫描。截至2021年8月,共有151,406名志愿者加入生物库,其中37,508人已完成第一轮随访。测量了所有参与者的全基因组基因型,其中一些其他数据类型也可用于队列的选定子集,包括全基因组测序(WGS)、DNA甲基化、人类白细胞抗原(HLA)分型和血液代谢组(表S2)。TWB一直定期以去识别格式向科学界发布其数据细胞基因组学2,100197,2022年11月9日3会开放获取资源图2.天水围的人口结构及家庭关系(A) 对QC基因型数据的主成分分析显示,TWB参与者中主要为汉族血统的同质群体结构,可进一步分为三个不同的亚组,代表不同的地理和祖先起源(Holo,Hakka和Mainlanders)。大陆人大致分为南方人和北方人,以便进行可视化(详细信息见表S4,基于Chen的GWAS样本等人3)。父亲和母亲祖籍相同的参与者被分配到一个单一的亚组;混合起源的参与者被分配A/B标签。TWB对1KG数据的投影显示与EAS超人群以及两个中国汉族人群紧密聚类(图S1)。这里显示的是第二批66,000人的结果。批次1的PC图(未显示)与批次2的结果几乎相同(B) TWB参与者的亲属关系估计显示,非平凡数量的相关性,包括超过25,000对在批次1和批次2中为三级亲属或更接近的对(表S5,基于Chen等人的GWAS样本)。3)。这里绘制的是第二批中亲属关系系数>0.02的个体对(y轴;在四级亲缘关系内),使用KING,4相对于具有0个等位基因的基因座的比例进行估计。虚线表示通常用于基于亲属系数确定成对家庭关系的截止点的中点(重复/同卵双胞胎:亲属关系> 0.353;父母-子女:0.177亲属关系0.353和Z 0 0.05;全同胞:0.177亲属关系0.353Z 0> 0.05;二级亲属:0.088<亲属关系0.177;三等亲属:0.044亲属关系0.088;四等亲属:亲属关系0.044)。大量的TWB参与者这些人被发现是四级亲属,其中10,000对随机子集被包括在图中用于演示目前的队列包括更多的女性比男性(64%对36%)和类似数量的参与者在每个10岁的年龄层。75%的参与者在基线时具有高中或更高的学历(图1B)。几乎所有的个体都是汉族后裔(图2A),反映了台湾的祖先组成。2我们使用TWB发布的108,955个个体证明了生物库的特征,这些个体在我们分析时具有全基因组基因型数据研究人群和参与作为一个前瞻性的、基于人群的队列研究,TWB一直在招募具有完全同意能力的成年人(年龄20-台湾的人口绝大多数是汉族,少数是原住民和新移民。2为确保不同的祖先来源得到适当的代表,TWB没有对种族/族裔群体施加排除标准。然而,从土著人民收集的数据受到严格的道德和法律约束,在台湾的指导方针。TWB的公开发布(包括此处描述的数据)不包含来自土著人民的信息。自TWB启动以来,在台湾各地的入组中心定期举行信息发布会,向公众宣传其目标、流程、知情同意和数据安全。虽然TWB的数据和发现主要用于研究活动,但参与者可以申请健康相关检查报告,并可以随时要求不再联系,不将其数据与其他数据库链接,或完全退出。表型程序在同意加入生物库后,参与者将接受体格检查和由训练有素的研究人员进行的结构化访谈,以在问卷中报告人口统计学、生活方式行为、环境暴露、饮食习惯、家族史和健康相关信息,平均持续1至1.5小时。TWB问卷由流行病学专家设计和审查;成立工作组以评估问题的清晰度和逻辑流程,并进行预测试和试点研究以验证4细胞基因组学2,100197,2022会开放获取资源3问卷调查。问卷的可靠性也在预测试时进行了测量,并通过比较基线和随访访视时的记录,以确保随着时间的推移,反应的稳定性和一致性。在基线时,参与者提供血液和尿液样本用于生物标志物和组学数据生成的实验室测定。处理生物样本用于实验,并进行质量控制(QC)程序以放行;将生成的敏感数据加密并存储在台湾中央研究院生物医学科学研究所。剩余的DNA、血浆和尿液样本被积极监测其状况,并可在额外费用下获得用于研究。在随访访视时,对基线时测量的表型进行重复评估。此外,利用从生物库用户收集的反馈,努力扩大到包括随访时的选定医学测试,以生成医学图像,例如腹部超声、骨质量密度和心电图,用于由来自合作医院的医学专业人员评估相关健康状况(图1A虽然后续程序正在缓慢扩大,但在重新联系的参与者中,留存率目前很高(70%-80%)。总之,在TWB中测量了超过1,000种表型(表1和S1),包括21种血液和尿液生物标志物,其指示一系列血液学、代谢、肾脏和肾脏疾病。肝功能(表S3)。表型关联和与国家登记中心的协调在参与者完全同意将他们的数据链接到外部数据库的情况下(可以在任何时候选择退出,无需理由),也可以通过链接到国民健康保险研究数据库(NHIRD)和超过70个涵盖台湾人口特定健康相关结果的其他数据库(如台湾癌症登记和死因登记)来获得问卷中未记录的个人疾病和健康信息。5台湾的全民健康保险(NHI)是一项于1995年设立的单一支付人强制性保险计划,为台湾所有公民(覆盖率> 99.99%)提供可获得且负担得起的医疗保健。6NHIRD是根据自2002年以来积极维护的NHI中的登记和索赔数据构建的,用于研究目的,并包含分类数据文件的扩展列表,例如受益人登记,药物处方登记,住院和门诊索赔,医疗设施登记和三个嵌入式纵向健康保险数据库。5通过与NHIRD中分配给每个人的唯一个人身份号码相连接,也可以获得仅在其他登记处和区域医院中提供的数据。 例如,台湾癌症登记处成立于1979年,包括一个基于流行病学的收集详细的癌症分期,治疗和复发信息的诊断为恶性肿瘤的住院和门诊患者。7TWB和这些医疗保健数据库之间的交叉链接目前仅允许目前正在努力将这些数据库中与健康相关的记录与TWB表型收集相结合。基因分型、QC和插补TWB开发了两种用于基因分型的定制单核苷酸多态性(SNP)阵列。设计的细节已经在前面描述过了。82011年基于Thermo Fisher Axiom全基因组CHB阵列,其定制内容包含约650,000个标记,的GRCh37坐标,提供全面全基因组关联研究(GWAS)的常见遗传变异覆盖率。为了不仅捕获GWAS标记,而且捕获功能变体,TWBv2阵列后来由Thermo Fisher Scientific在2017年设计,以故意丰富罕见编码风险等位基因的内容(例如,基于来自946个TWB样品的WGS数据,包括约690,000个标记与GRCh38参考构建对齐。约28,000和约81,000名参与者分别在TWBv1阵列和TWBv2阵列分别具有1,462个双链体,对在两个阵列上分型的个体进行分类以评估SNP调用的一致性。这两个阵列共享约100,000个标记。我们在下面提供了关于数据质量和结构的概述,基于TWB参与者子集的TWB遗传数据,包括TWBv1(批次1)基因分型的所有个体,以及TWBv 2基因分型的约85%(批次2; n约69,000),在相关工作中描述(参见STAR方法中的详细信息;Ta-表1)。使用TWB数据的其他研究可能遵循不同样本量的不同QC流程,但应适用一般规则。简而言之,我们对每个批次单独进行QC,包括去除变异体和高缺失率样本的插补前QC;主成分分析(PCA),以推断遗传祖先并识别群体离群值,其中1000个基因组(1 KG; RRID:SCR_006828)样本11作为参考组;东亚 内 ( EAS ) QC , 其 丢 弃 具 有 低 调 用 率 或 未 通 过 Hardy-Weinberg平衡(HWE)检验的变体;使用1 KG-EAS组对TWB基因型进行定相和插补;最后,插补后QC,其去除插补质量差(INFO评分)或低次要等位基因频率(MAF)的额外变体。在INFO> 0.6时,插补数据中的MAF分布显示每个批次包含约10%的非常罕见的变体(MAF 0.001),约15%罕见变异(0.001 MAF 0.01),约15%低频变体(0.01 MAF 0.05),约60%常见变体(0.05MAF 0.5)(图S1)。保留有插补的变体插补后,质量INFO评分> 0.6且MAF> 0.5%,最终分析样本由约93,000个个体中的约800万个变异组成(批次1中n约27,000,批次2中n约66,000;3表1)。先前的研究表明,参考样本组和目标样本之间更大的遗传10,12利用TWB中的2,000人WGS数据集(表S2),内部正在努力开发一个群体特异性参考面板和服务器,用于中国汉族个体的基因型人口结构和分组在基于人群的流行病学和遗传关联分析中,祖先背景是一个需要研究和计算的重要特征结合自我报告和一系列的主成分分析,我们模拟了遗传多样性和推断遗传祖先的TWB参与者。结果显示细胞基因组学2,100197,2022年11月9日5会开放获取资源表1. TWB参与者基线样本特征概述具有可用基因型数据的特征样品a3,b所有雄性雌性批次1(TWBv1)批次2(TWBv2)人数108,955 39,410 69,545 27,033 65,582年龄(平均值±SD)49.9±10.9 49.9 ±11.3 49.9 ± 10.7 48.8±11.1 50.5 ± 10.7性别(妇女%)体重指数(kg/m2;平均值±标准差)24.2±3.8 25.4 ± 3.5 23.6± 3.7 24.3±3.7 24.2 ± 3.8吸烟经历(n; %)从未或很少87,742(81%)21,934(56%)65,808(95%)20,555(76%)55,190(84%)曾吸烟者10,993(10%)9,282(24%)1,711(2.5%)3,272(12%)6,191(9.4%)目前吸烟者10,218(9.4%)8,192(21%)2,026(2.9%)3,194(12%)5,623(8.6%)饮酒(n; %)从未或很少99,711(92%)32,071(81%)67,640(97%)24,298(90%)61,870(94%)曾饮酒者2,790(2.6%)2,208(5.6%)582(0.8%)788(2.9%)1,578(2.4%)目前饮酒者6,395(5.9%)5,106(13.0%)1,289(1.9%)1,913(7.1%)3,556(5.4%)定量测量(平均值±SD)收缩压(mmHg)119.3± 17.9 125.0± 16.5 116.1± 17.8 118.2±17.4 119.7 ± 18.1低密度脂蛋白胆固醇(mg/dL)120.8± 31.7 121.7± 31.4 120.4± 31.8 120.9±31.7 120.8 ± 31.6FEV1.0/FVC(%)79.8±17.5 79.7 ±17.4 79.9 ± 17.5 73.1±18.8 81.1 ± 17.1空腹血糖(mg/dL)95.9±20.6 99.4 ±23.4 93.9 ± 18.5 96.3±21.0 95.7 ± 20.5肌酐(mg/dL)0.72±0.31 0.91 ± 0.37 0.62± 0.21 0.76±0.36 0.71 ± 0.30白蛋白(g/dL)4.52±0.23 4.59 ±0.24 4.48 ± 0.22 4.56±0.24 4.50 ± 0.23TWB中最常见的自我报告疾病(n; %)消化性溃疡15,926(15%)6,548(17%)9,378(13%)3,923(15%)9,897(15%)胃食管反流病(GERD)14,682(13%)5,054(13%)9,628(14%)3,306(12%)9,145(14%)高血压13,432(12%)6,667(17%)6,765(9.7%)3,297(12%)8,445(13%)药物治疗10,243(9.4%)2,934(7.4%)7,309(11%)2,403(8.9%)6,485(9.9%)高血压8,019(7.4%)3,615(9.2%)4,404(6.3%)1,884(7.0%)5,020(7.7%)肾结石7,003(6.4%)4,225(11%)2,778(4.0%)1,973(7.3%)4,116(6.3%)参见表S1。a在我们分析时具有基线全基因组基因分型数据的TWB样本。b使用两种定制基因分型阵列TWBv 1(批次1,n~ 28,000)和TWBv 2(批次2,n~ 81,000)对TWB参与者进行基因分型GWAS包括TWBv 1个体和~85%的TWBv 2个体3此处显示了批次特定基因型QC后的最终分析样品TWB的人口结构是高度同质的,主要由汉族血统的台湾人组成(>99%;图 2A,S2A和S2 B),与全国人口普查中台湾的种族/民族人口统计基本一致。2基于TWB的QC(~78%)自称是荷罗(或Hoklo)或客家人-这两个台湾最大的汉族群体来自南方,以及1949年后移民到台湾可追溯至中国内地不同省份(约6%有趣的是,虽然荷洛人和客家人都起源于中国东南沿海,在相邻地区--主要是福建和广东省--PCA表明两个民族之间的遗传变异存在差异,这可能归因于两个地区之间的在大陆人中,以及那些在霍洛之间有混合祖先血统的人客家人和内地人之间的遗传变异也呈现出南北向的梯度,这与汉族人口的迁徙历史相一致13另外的PC在相对于彼此绘制时形成单个球形簇,没有显示子结构的额外迹象(图S2C)。家系结构及相关样本的遗传分析研究参与者之间的家庭关系为流行病学和遗传学研究提供了重要的分析考虑因素。使用全基因组基因型数据,我们估计成对的亲属关系系数TWB参与者,以确定相关的个人没有在问卷中报告。之间两批约93,000名参与者(表1),26,693名(28.8%)被发现至少有一个相关的个人,三度或更近,形成超过25,000对相关对,包括9对重复或单卵(MZ)双胞胎,4,154对亲子对,5,079对兄弟姐妹对,2,756对二级亲属和> 10,000对三级亲属6细胞基因组学2,100197,2022会开放获取资源亲缘关系(表S5;批次2结果见图2B)。配对相关性的非平凡数量可能是由于在当地社区进行的招募,家庭成员可能住在附近,并且更有可能在被告知TWB活动时一起招募或邀请彼此参加。考虑到TWB的遗传相关程度,我们考虑了直接模拟所有样本相关性的遗传关联检验,以最大限度地提高GWAS的功效遗传研究中的相关性感知分析方法的概述包括开发用于有效分析生物库规模数据集的方法(例如,基于混合模型的SAIGE [Scalableand Accurate Implementation of GEneralized mixed model]和SAIGE-GENE)。为此,我们使用了类似的方法REGENIE,这是一种两步全基因组回归,可以解释样本相关性和群体结构。对GWAS结果的评估显示,I型错误得到了充分的控制,限制对不相关个体的分析能力得到了提高,突出了应用可缩放混合模型方法分析具有一定参与者相关性的大型基因组学数据集的价值1、3生物库的独特属性除了不同生物库中常见的表型外,TWB还测量了台湾人口作为东亚和东南亚一部分的生活方式特征和环境暴露。例如,包括问卷中的问题涉及接触不同类型的熏香,如宗教仪式中使用的蚊香和香,以及咀嚼槟榔,这是一种与不利健康风险有关的文化传统。16此外,TWB采用了一个44项体质问卷17,根据传统中医理论,将个人分为一个或多个体质类型,根据这些体质类型可以推断出一个人基于TWB的利用TWB数据的几项工作已经证明了其在人类遗传研究和扩大人口多样性方面的价值在东亚的基因组研究中。基于最初释放的10,000个个体,早期的调查提供了对TWB群体结构的更深入的研究,表明除了北方和南方汉族人之外,还有第三个与南方汉族人遗传相似的聚类,但在主要组织相容性复合体区域具有扩展的单倍型,可能反映了更近的进化事件。8利用TWB中不同类型的身体活动测量,研究人员发现,几种运动,如定期慢跑和爬山,可以减弱遗传对肥胖和体重指数(BMI)的影响,这表明证据与欧洲(EUR)为中心的遗传研究的重要发现一致。18在TWB参与者的一个子集中进行测量,来自TWB的1,445个个体中至少303个覆盖率的WGS数据已被证明优于1KG EAS样本,汉族血统个体的插补面板,提供了适度但一致的改善。10探索这种汉族特异性参考组还导致鉴定了大量群体特异性罕见变异,其中许多在现有的大型等位基因频率数据库中未见(例如,gnomAD19),其具有促进发现罕见致病变体的潜力,并且与来自TWB阵列数据的关于常见遗传变异的可用信息相结合,以改善疾病的基因组预测(例如,高血压)。9最近,我们检查了36个数量性状的遗传结构,包括人体测量性状和生物标志物,在TWB,日本生物银行和英国生物银行中,我们确定了TWB特异性的新遗传基因座,将其精细定位到推定的因果变异体,表明这些性状的遗传结构在EAS内以及EAS和EUR群体之间基本一致,并提出了生物标志物GWASs在跨人群、多性状环境中复杂疾病的多基因风险预测中的实用性。3讨论TWB正在将生物医学研究转化为台湾人口健康和疾病在这里,我们呈现TWB资源的概述(n~2021年15万人),说明人口结构和家庭-TWB中的特殊关系,并强调TWB的独特方面和当前的遗传发现。在未来几年,TWB将继续扩大样本量,积累纵向和重复测量,并在入组受试者中生成分子表型。通过努力将主题联系起来对于自1995年以来几乎涵盖了台湾所有公民的NHIRD和其他登记机构,TWB将发展成为一个宝贵的资源,整合了长期以来丰富的表型和多组学数据,履行其改善台湾公共卫生的使命。作为东亚最大的生物库之一,TWB还将通过与其他全球生物库的综合和比较研究,为世界人口中人类复杂疾病和特征的洞察做出贡献,正如GBMI特刊及其他一系列研究所证明的那样。1、3该研究TWB的一个值得注意的问题是,基于社区的抽样数据可能不具有人口代表性,队列中女性明显多于男性,并且没有儿童。仅根据自我报告,几种常见疾病的样本内患病率也低于一般成年人群(例如,高血压,TWB中为12.5%,而台湾卫生福利部报告的20岁及以上成年人的高血压发生率为26%;表S6),这可能反映了来自自我报告的偏倚或与英国生物库中观察到的健康志愿者偏倚相似。20另一方面,随着未来与NHIRD和其他登记处的联系,TWB将为研究广泛疾病的遗传和环境责任提供有用的资源,并且纵向结果超出了汉族人群的自我报告,包括那些传统上在中国更普遍的疾病。细胞基因组学2,100197,2022年11月9日7会开放获取资源台湾及邻近地区的鼻咽癌、肝病等。二十一,二十二STAR+方法本文件的在线版本提供了详细的方法,包括以下内容:d关键资源表d资源可用性B电极导线触点B材料供应情况B数据和代码可用性d方法样本B基因型数据质量控制B.家庭关系BTWB中的相关性感知GWAS分析补充信息补 充 信 息 可 以 在 www.example.com 上 找 到 https://doi.org/10.1016/j 。xgen.2022.100197。致谢这项研究是利用台湾生物银行资源进行的。我们感谢台湾生物库的所有参与者和研究人员。我们感谢台湾国家基因组医学中心在基因分型方面的技术支持。我们感谢国家生物制药核心设施(NCFB,MOST 106-2319-B-492-002)和台湾国家应用研究实验室(NARLabs)的国家高性能计算中心(NCHC)提供计算和存储资源。YFL 由台湾国立卫生研究院(NP-109-PP-09; NP-110-PP-09)和科技部(109-2314-B-400-017; 110-2314-B- 400-028-MY 3)支持T.G.由 NIA K99/R 00 AG 054573 支 持H.H. 获 得 NIDDK K01DK114379 、NIMHU01MH 109539、脑行为研究基金会青年研究者基金会、正旭和英和基金会以及斯坦利精神病学研究中心的知识支持Y.A. F 和P.H.K.在台湾教育部(MoE)的高等教育资助计划框架内,由“国立台湾大学高等教育资助计划”(NTU-110 L 8810)提供支持Y.A. F 国立台湾大学(NTU-111 V1020 -1)MoE玉山青年研究员计划的支持H.Y.H. 确认NIAMS R01AR072199的支持本工作中台湾生物库数据的访问和使用获得了台湾生物库伦理与治理委员会(EGC)(批准号:TWBR 10907 -05)和台湾国立卫生研究院IRB(批准号:EC 1090402-E)的批准。台湾生物样本库的数据收集得到台湾生物样本库EGC和台湾卫生福利部的批准(卫术一字第1001号)。1010267471)。Taiwan Biobank获得了所有参与者的知情同意书,以便将收集的数据和样本用于研究。作者贡献Y.A. F以Y的关键输入作为原稿的开头。F.L.,C.- Y.C.,H. H.和T.G. C.- Y.S.H.- I.Y.在构思和设计台湾生物库方面发挥了关键作用; M.- W.S. H.- W.C.领导生物库的实施和维护工作。T.- TC P. -香港,Y.-- H. H.还有WJC 提供工作所需的分析或机构支持Y.A. F 编写了手册脚本,经过所有作者的严格审查,修改和批准提交。申报利益C.- Y.C.是Biogen的员工包容性和多样性我们支持包容,多样和公平的研究行为。投稿时间:2021 - 12 - 21修订日期:2022受理时间:2022发布时间:2022引用1. 周文,Kanai,M.,吴,K.- H. H.拉希德,H.,Tsuo,K.,Hirbo,J.B.,王玉,Bhattacharya,A.,赵,H.,难波,S.,等人(2022年)。全球生物库 荟萃分析 倡议:推 动人类疾 病的基 因发现。 细胞基因 组学2 ,100192。https://doi.org/10.1016/j.xgen.2022的网站。100192。2. 行政院与中华民国(台湾)(2016)。《中华民国年鉴》3. 陈春是的,陈文T.,冯玉-- CA,朗尚,R.J.,林,S.- C.的方法,王世文H、徐玉H、杨,H.-一、Kuo,P.- H、戴利,M.J.,等(2021年)。通过对台湾生物库、日本生物库和英国生物库的分析,确定了36个数量性状的数百个新位点。medRxiv上的预印本。https://doi.org/10.1101/2021.04.12.21255236网站。4. Fuchsberger,C.,Abecasis ,G.R. ,和地检官海因兹(2015 年)。Minimac2 : 更 快 的 基 因 型 插 补 。 生 物 信 息 学 31 , 782-784 。https://doi.org/10的网站。1093/bioinformatics/btu704.5. 谢角,越-地是的,苏角C.的方法,Shao,S.-C.的方法,Sung,S.-F.、林,S.-J.,杨高,Y.H、和Lai,E.C.-C. (2019年)。台湾临床流行病学11,349-358. https://doi.org/10.2147/clep.s196293。6. 中华民国卫生福利部国家健康保险管理局(2014年)。2014-2015年度报告7. Chiang,C.- J.,王玉- W.,李,W。C.(2019年)。台湾J·福莫斯医学协会118,856-858。https://doi.org/10.1016/j.jfma.2019.01.012网站。8. 陈春H、杨,J. - H、蒋,C.W.K.,Hsiung,C.- N.,吴,P. - E、昌湖,澳 -地C. 的方 法,Chu , H.W.,张 ,J. ,宋 ,I.W.,Yang , S.L.,等(2016)。现代台湾人口中汉族的人口结构--基于台湾生物数据库10,000名 参 与 者 。 Hum. 摩 尔 Genet.25, 5321-5331。https://doi.org/10.1093/hmg/ddw346网站。9. Juang,J.- M.J. Lu,T.- P.,苏,M.- W.,林角,英-地W.,杨,J. - H、Chu,H.- W.,陈春H、Hsiao,Y.- W.,李角,澳-地是的,蒋湖M.,等(2021年)。台湾汉族人群广泛全基因组测序发现罕见变异:在心血管医学中的应用。J.广告。Res.30,147-158.https://doi.org/10.1016/j.jare.2020.12.003网站。10. 韦角,澳-地是的,杨,J. - H、是的E C.的方法,Tsai,M.- F.、Kao,H.-J.,罗,C.- Z.,昌湖,澳-地P.,林,W.-J.,Hsieh,F.J.,Belsare,S.,等人(2021年)。台湾生物库中103,106个个体的基因图谱提供了对 汉 族 人 健 康 和 历 史 的 见 解 NPJ Genom. Med.6 , 10. 网 址 : //doi.org/10.1038/s41525-021-00178-9。11. 1000个基因组计划联盟; Auton,A.,Brooks,L.D.,Durbin,R.M.,加里森,E.P.,康,H.M.,Korbel,J.O.,Marchini,J.L.,McCarthy,S.,McVean,GA,和Abecasis,G.R.(2015年)。人类遗传变异的全球参考。Nature526,68-74. https://doi.org/10.1038/na-ture15393.12. 吴,D.,窦,J.,Chai,X.,贝利斯角,Wilm,A.,施正正,很快,W.W.J,Bertin,N.,Lin,C.B.,Khor,C.C.,等(2019)。新加坡三个不同亚 洲 人 群 的 大 规 模 全 基 因 组 测 序 。 细 胞 179 , 736-749.e15 。https://doi.org/10.1016/j.cell.2019.09.019网站。8细胞基因组学2,100197,2022会开放获取资源13. 陈杰,郑洪,Bei,J.-X.,孙湖,加-地贾,W.-H、Li,T.,张福,Seiel-stad,M.,曾玉X.,张,X.,和Liu,J.(2009年)。全基因组SNP变异揭示 的 中 国 汉 族 群 体 遗 传 结 构 Am. J. 哈 姆 。 Genet. 85 , 775-785 。https://doi.org/10.1016/j.ajhg.2009.10.016网站。14. Brumpton,B.M.,Graham,S.,苏拉卡岛Skogholt,A.H.,Løset,M.,Frit-sche,L.G.,Wolford,B.,周文,J.B.尼尔森,Holmen,O.L.,等(2022年)。HUNT研究:一项基于人群的遗传研究队列细胞基因组学2,100193。https://doi.org/10.1016/j.xgen.2022.100193网站。15. Mbatchou , J., 巴纳 德湖 Backman, J., Marketta , A., Kosmicki,J.A. , Ziyatdinov , A. , 本 纳 角 ,O'Dushlaine , C. ,巴 伯 , M. ,Boutkov,B., 等人(2021年)。用于定量和二元性状的计算高效的全基因 组 回 归 Nat. Genet. 53 , 1097-1103 。 https://doi.org/10 的 网 站 。1038/s41588-021-00870-7。16. P.C.古普塔,和Warnakulasuriya,S.(2002年)的报告。槟榔使用的全球流行病学。瘾君子Biol.7,77-83.https://doi.org/10.1080/13556210020091437.17. 林,J. -D、林,J. -美国,陈湖,澳-地L.,昌角,澳-地H、黄玉-C.的方法,和Su,Y.-C.(2012年)。BCQs:一种用于评估中医郁滞状态的体质 问 卷 。 EUR.J. 积 分 4 , e379-e391 。 网 址 : //doi.org/10.1016/j.eujim.2012.05.001。18. 林,W.-是的,Chan,C.- C.的方法,刘玉- L.,杨,A.C.,蔡氏J.,和Kuo,P. -H.(2019年)。进行不同类型的体育锻炼对肥胖测量的遗传效应有差异:来自18,424名台湾生物样本库参与者的证据。PLoS基因组15,e1008277。网址://doi. org/10.1371/journal.pgen.1008277。19. Karczewski,K.J.,Francioli,L.C.,Tiao,G.,Cummings,B. B.,Alfo¨ ldi,J.,王建奎,Collins,R.L.,Laricchia,K.M.,Ganna,A.,Birnbaum,D.P.,等人(2020年)。突变限制谱从141,456人的变异中量化Nature581,434-443. https://doi.org/10.1038/s41586-020-2308-7.20. Fry , A. , 小 约 翰 , TJ , 萨 德 洛 角 , Doherty , N. , 阿 达 姆 斯 卡 湖Sprosen,T.,柯林斯河和Allen,N.E.(2017)。英国生物库参与者与普通 人 群 的 社 会人 口 学 和 健 康 相 关 特 征Am. J. Epidemiol. 186 , 1026-1034。https://doi.org/10的网站。1093/aje/kwx246。21. 张外星人Adami,H.- O.(2006年)。神秘的鼻咽癌流行病学。癌症流行病 学 生 物 标 志 物 Prev. 15 , 1765-1777 。 https://doi.org/10.1158/1055-9965.epi-06-0353网站。22. 沙林,S.K.,Kumar,M.,埃斯拉姆,M.,乔治,J.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 京瓷TASKalfa系列维修手册:安全与操作指南
- 小波变换在视频压缩中的应用
- Microsoft OfficeXP详解:WordXP、ExcelXP和PowerPointXP
- 雀巢在线媒介投放策划:门户网站与广告效果分析
- 用友NC-V56供应链功能升级详解(84页)
- 计算机病毒与防御策略探索
- 企业网NAT技术实践:2022年部署互联网出口策略
- 软件测试面试必备:概念、原则与常见问题解析
- 2022年Windows IIS服务器内外网配置详解与Serv-U FTP服务器安装
- 中国联通:企业级ICT转型与创新实践
- C#图形图像编程深入解析:GDI+与多媒体应用
- Xilinx AXI Interconnect v2.1用户指南
- DIY编程电缆全攻略:接口类型与自制指南
- 电脑维护与硬盘数据恢复指南
- 计算机网络技术专业剖析:人才培养与改革
- 量化多因子指数增强策略:微观视角的实证分析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功