没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁25(2021)100680甲状腺癌的基因和共病Branimir Ljubica,b,Martin Pavlovski a,Shoumik Roychoudhury a,Christophe Van Nestec, d,放大图片作者:Adil Salhid,Magbubah Jumack d,Vladimir B. Bajicd,Zoran Obradovic a,*a天普大学数据分析和生物医学信息学中心(DABI),费城,宾夕法尼亚州,19122,美国b罗格斯大学,高级研究计算办公室(OARC),Piscataway,NJ,08854,美国c比利时根特大学医学遗传学中心(CMGG)d阿卜杜拉国王科技大学,计算生物科学研究中心,计算机、电气和数学科学与工程部,沙特阿拉伯图瓦尔A R T I C L EI N FO关键词:甲状腺癌合并症基因文本挖掘生物医学信息学A B S T R A C T简介:甲状腺癌占美国确诊癌症的3.1%。这项研究的目的是确定合并症,发现其他可能与甲状腺癌相关的基因,并提高目前对这种癌症相关的遗传学和合并症的认识方法:利用加州住院患者数据库(SID)中的医疗成本和利用项目(HCUP),提取甲状腺癌的合并症并进行排序。使用文本挖掘软件BeFree从PubMed摘要和Dis-GeNET专家库中识别和提取与甲状腺癌和合并症相关的基因。结果:女性患者有4,485例,男性患者有2912例甲状腺癌早期不同的合并症。女性有3,587例,男性有2817例不同的晚期合并症。通过PubMed使用BeFree方法,发现了504个与甲状腺癌相关的不同基因,以及DisGeNET上的5个 基因 。 PubMed上 最常 见 的与 甲 状腺 癌 相关 的 基因 是 : BRAF, RET, SLC5A5, RAS和 PTEN。 通 过DisGeNET发现的基因是BRAF,RET,KRAS,NRAS和PRKAR1A。结论:识别出的基因和合并症作为甲状腺癌的潜在额外危险因素,而不是预先已知的,可以提高甲状腺癌的早期诊断和患者的生存率。这项研究中发现的与甲状腺癌相关的基因可用于指导甲状腺癌的最佳,更个性化治疗的决策。1. 介绍甲状腺癌(ThyCa)起源于甲状腺,位于颈部前部,喉部下方ThyCa代表3.1%的美国新诊断的癌症,主要发生在女性中[1美国每年约有53,990例新诊断的ThyCa病例和2060例死亡,ThyCa的发病率为每10万人14.3例[2,3]。类似的事件发生在在世界上许多其他国家都可以看到。ThyCa有四种亚型:乳头状癌(>85%的病例)、滤泡癌(5患有合并症的患者生活质量较低[5]。合并症会对患者的整体健康产生负面影响ThyCa患者发生心脏和血管疾病(CVD)的风险很高[6]。观察性研究提供了ThyCa和肥胖之间潜在关联的证据[7]。严重的胰岛素抵抗可能与儿童时期侵袭性乳头状ThyCa相关。遗传分析显示BSCL 2基因突变[8]。NRAS基因的Q61 R突变是ThyCa最常见的驱动突变之一[9]。对甲状腺结节患者的评估显示,4.6%的患者有TERT启动子突变,59.2%的患者有BRAF基因突变[10]。PFKFB 2启动子甲基化分析具有潜在的适用性,可根据复发风险更好地对分化良好的ThyCa患者进行分层[11]。乳头状ThyCa 患 者 具 有 显 著 过 表 达 的 基 因 :SDC1 ( syndecan 1 ) 、 SDC4(syndecan 4)、KLK 7、KLK 10、SLPI、GDF 15、ALOX 5和SFRP 2等[12]。关于20.5%的标本在RAS亚家族(HRAS,KRAS)中有突变或NRAS),亚型之间没有很大差异。TSHR、DICER 1、EIF1AX、KDM 5C、NF 1、PTEN和TP 53的突变被发现是与肿瘤的发生有关的。* 通讯作者。Temple University,SERC 035-02 Center for Data Analytics and Biomedical Informatics,1925 N 12th St,Philadelphia,PA,19122,USA.电子邮件地址:zoran. temple.edu(Z.Obradovic)。https://doi.org/10.1016/j.imu.2021.100680接收日期:2021年2月2日;接收日期:2021年7月16日;接受日期:2021年2021年7月26日在线提供2352-9148/©2021的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuB. Ljubic等人医学信息学解锁25(2021)1006802在ThyCa患者中复发[13]。我们研究的目的是确定与ThyCa潜在相关的合并症和基因。我们使用HCUP SID California数据库提取ThyCa不同阶段的合并症。我们研究的下一个目标是分析ThyCa与基因合并症之间的关联。我们利用PubMed的文本挖掘来识别可能与ThyCa和合并症相关的基因。DisGeNET(专家来源)[14]和癌症基因组图谱(TCGA)用于验证PubMed文本挖掘的结果[15]。DisGeNET是人类疾病相关基因的最大集合之一。它整合了来自专家策划的存储库,GWAS目录,动物模型和科学出版物的数据。我们研究的总体目标是分析合并症,鉴定可能与ThyCa和合并症相关的其他基因,并改善目前对ThyCa相关基因和合并症的认识。我们纳入了所有未诊断转移的ThyCa患者(ICD 9代码193)进入癌症早期阶段,并纳入了已诊断转移的ThyCa患者(ICD 9代码196,197,198)进入晚期阶段。HCUP数据库仅包含ThyCa的诊断代码,没有癌症类型或阶段的说明,这将我们的合并症分析限制为一般ThyCa诊断,而不可能单独分析每种类型ThyCa的合并症在50岁及以下的患者组中,HCUP数据库中确定的ThyCa患者数量为相对较小,我们有无转移在50岁以上的患者组中,分析了数据,并根据其患病率创建了合并症的排名列表,分别针对男性和女性的早期和晚期ThyCa。我们根据以下公式计算了每种ThyCa合并症识别基因和合并症,作为潜在的风险因素,P=ni(一)提高ThyCa的早期诊断和ThyCa患者的生存率2. 背景和意义对378名ThyCa患者进行了一项基于人群的观察性研究,目的是分析与性别、年龄、组织学类型和治疗相关的合并症患病率[16]。这项研究旨在显示合并症对ThyCa治疗和生存的可能影响。另一项研究旨在评估合并症在ThyCa患者总体死亡率和死亡原因中的作用[17]。有3种或3种以上合并症的组总生存期较短。患有共病的ThyCa患者的生活质量较低[18]。Hu及其同事提出,遗传变异导致ThyCa异质性[19]。ThyCa代表一种肿瘤,其中关键基因通常通过两种不同的分子机制发生突变:点突变(BRAF,RAS,TP 53和CTNNB 1)和染色体重排(RET基因与称为RET/PTC重排的基因融合)。基因治疗是ThyCa最有前途的新型治疗方法之一[20]。Arma- nious及其合作者报告了一种基因表达测定技术,该技术可能有助于ThyCa的鉴别诊断[21]。需要各种基因组合来分类特定的ThyCas。这些和其他研究提出了合并症和基因在ThyCa患者生存、生活质量和死亡率中的重要性。他们还强调了基因在现代治疗方法中的重要性已发表的研究描述了一些众所周知的关联,基因和ThyCa。研究人员分析了一些最常见的合并症对ThyCa患者生活质量和死亡率的影响。我们的研究是在一个更大的数据集(HCUP)上进行的。我们纳入了与ThyCa相关的所有可能的合并症。此外,通过PubMed的文本挖掘,我们试图提取以前未知的基因-ThyCa-合并症关联,这些关联可能用于ThyCa的诊断和治疗。BeFree文本挖掘系统是专门为生物医学来源的文本挖掘而设计的,通过使用来自文本的形态句法信息[22],用于从PubMed中提取ThyCa-共显性基因相关性。BeFree文本挖掘系统已成功应用于不同的文本挖掘检索PubMed和其他生物医学来源[233. 方法我们从HCUP SID California数据库(ICD 9格式)中提取了与ThyCa相关的合并症。该数据库收集了474家医院9年(2003年1月至2011年12月)的35,844,800份住院患者出院记录。我们分别完成了对50岁以下患者和50岁以上患者的分析。在年龄大于50岁的患者组中,下载与ThyCa相关的合并症,并将其分为2组:a)与早期阶段相关的数据和b)与晚期阶段相关的数据。我不Pi是患病率,ni是合并症患者数量,T是HCUP数据库中ThyCa患者总数。接下来,我们使用BeFree文本挖掘系统对PubMed摘要进行文本挖掘,以提取与ThyCa和合并症相关的基因。PubMed(MEDLINE)数据库包含超过3000万篇引文和摘要(截至2020年1月大约有两千万PubMed的记录有摘要。我们对PubMed(MEDLINE)数据库进行文本挖掘的第一步是提取所有关于ThyCa的文章,因为这是我们研究的重点。我们确定了超过54,500篇主题为ThyCa的PubMed摘要。在下一步中,我们确定了这些PubMed摘要中与ThyCa相关的所有基因。此外,合并症的排名列表用于PubMed摘要的文本挖掘,以识别与ThyCa和合并症相关的常见基因。我们还从专家策划的来源(DisGeNET)中提取了基因与疾病将PubMed文献中发现的基因-ThyCa,合并症关联与DisGeNET中收集的基因-ThyCa,合并症关联进行比较。我们统计并列出了PubMed中的摘要数量,以及描述基因-ThyCa-合并症相关性的精选专家来源。我们还比较了基因的发现与TCGA遗传数据库中包含的基因ThyCa协会。使用Python和R编程语言进行分析。作为对照,我们使用Dragon EX探索系统(DES)来寻找与ThyCa潜在相关的基因。DES框架的工作流程已在参考文献[26]中描述。我们通过DES 系 统使 用 本地 MongoDB 上 的查 询 生成 结 果, MongoDB 用 作PubMed和PubMed Central文献库:蛋白质)和(4. 结果4.1. ThyCa相关合并症在50岁以上的患者组中,ThyCa早期阶段的女性患者总数为12,771例(HCUP数据),晚期阶段为4725例。我们在ThyCa的早期阶段发现了4485种不同的合并症,在晚期阶段发现了3587种。我们构建了ThyCa早期和晚期女性患者发生的前50种合并症(HCUP数据)的排名列表,并计算(公式1)其发生率(表1)。在这两个阶段中,女性最常见的合并症是B. Ljubic等人医学信息学解锁25(2021)1006803表150岁以上女性患者中ThyCa早期和晚期的前50种合并症及其发展的患病率(HCUP数据)。女性中的ThyCa合并症表1(续)女性中的ThyCa合并症1原发性高血压2收购甲减0.36高血压0.18恶性肿瘤史甲状腺新0.410.3543长期服用阿司匹林44妊娠期甲状腺青霉素0.03恶心呕吐0.05听力损失0.053甲状腺恶性肿瘤病史0.17术后甲状腺功能减退症0.2445例急性出血后0.03部分单侧声带麻痹0.054获得Hyperstrom 0.17甲减0.23贫血46长期使用0.03疾病0.055食管癌X6术后甲状腺功能减退0.17 Hyperspace 0.190.15贫血胰岛素47个人历史镁代谢0.03胸痛2型糖尿病的治疗0.13食管扩张X0.18照射48收购0.03长期使用0.042型糖尿病的治疗方法0.18甲减49例急性呼吸道疾病胰岛素0.02急性0.049分娩,单活产10哮喘11贫血0.10低钾血症0.1312低钙血症0.10肥胖症0.13阿司匹林高血压,早期患病率低于晚期。 的13个人烟草使用尿路感染0.12接下来几种最常见的合并症是不同形式的假设-14纯0.09个人经历0.12甲状腺功能减退症、ThyCa病史、术后甲状腺功能减退症以及其他高胆15例非X线多结节性甲状腺肿照射分娩,单胎活产0.12甲状腺疾病,这是这一人群的特殊发现。高血压(肥胖)、2型糖尿病、尿路感染,16抑郁症心血管疾病、贫血、食管癌、哮喘、抑郁症17慢性淋巴细胞性哮喘0.10疾病,辐射史是最常见的并发症之一甲状腺炎18低钾血症19在诊断为ThyCa的患者中,这些疾病在疾病的晚期阶段这些发现也可能有老化,焦虑0.07纯高胆0.10一个混杂变量,但是ThyCa和甲状腺疾病的历史20尿路感染0.06脱水0.0921烟草依赖0.06焦虑0.09不能仅仅归因于老龄化,它们与相同年龄的一般人群中的预期结果不同。22骨质疏松症0.06低渗/0.09在50岁以上的患者组23骨关节病0.06急性呼吸衰竭0.08ThyCa早期患者为10,425例,晚期患者为2389例。我们在2009年的男性患者中发现了2912种不同的合并症,24抗肿瘤0.06蚂蚁0.08早期阶段和2817种不同的晚期合并症。放射治疗25非X线单结节放射治疗骨质疏松症表2显示了前50种合并症以及它们在ThyCa早期和晚期发展的患病率。甲状腺肿26冠状动脉粥样硬化0.05充血性心力衰竭0.07男性患者最常合并高血压,晚期患病率男性的患病率较高,27病态肥胖0.05心房纤颤0.07吸烟史,2型糖尿病,心血管疾病,28充血性心力0.05连续性0.07例,高脂血症高于女性患者,而女性有较高的失败29脱水0.04骨关节病0.07抑郁症和尿路感染的患病率。300.04乳腺癌的历史0.07表3显示了ThyCa的按患病率排序的合并症,31青霉素过敏史32乳腺癌病史33心律失常34房颤35胸痛0.04冠状动脉粥样硬化0.07年龄在50岁及以下的男性和女性患者。我们确定了1421名男性患者和1547名女性患者患有ThyCa,50.在研究期间,HCUP包含该年龄组的少量患者,因此我们一起分析了所有患者,不考虑转移。该年龄组的男性有较高的原发性高血压、烟草使用障碍、高脂血症和糖尿病的患病率。比女性多。女性患者贫血患病率较高,36交货后状态0.04蛋白质热量营养不良0.06低钾血症、尿路感染、肥胖和抑郁症患者多于男性。37良性肿瘤0.04胸腔积液0.06HCUP SID中发现的ThyCa合并症的完整列表甲状腺38肺炎0.04肺萎陷0.05加利福尼亚数据集作为补充表S1提供。与ThyCa及其合并症相关的基因。39低渗透压和/或低钠血症0.04肺不张甲状0.05此外,我们文本挖掘PubMed摘要,以确定与ThyCa及其合并症相关的基因。我们发现了504种不同的基因,40偏头痛0.03病态肥胖0.05与PubMed摘要中的ThyCa相关(参见补充表S2)。41慢性阻塞性肺病0.03获得性甲状腺功能减退症0.05然而,只有154个基因出现在两个或多个摘要中(表4)。在DisGeNET中,我们确定了与ThyCa相关的五个不同基因。这些基因分别是BRAF(DisGeNET评分-0.4)、RET(0.4)、KRAS(早期阶段晚期科摩罗病患病率科摩罗病患病率42急性肾衰竭0.03过敏史0.05早期阶段晚期科摩罗病患病率科摩罗病患病率0.11低钙血症0.16失败出血后贫血0.10个人烟草使用0.1450蛋白质热量营养不良0.02长期使用0.040.04烟草依赖0.070.04心律失常0.060.04急性肾衰竭0.060.04慢性阻塞性0.06B. Ljubic等人医学信息学解锁25(2021)1006804表250岁以上男性患者中ThyCa早期和晚期的前50种合并症及其发展的患病率(HCUP数据)。男性中的ThyCa合并症表2(续)男性中的ThyCa合并症早期阶段早期阶段40肾及输尿管病症0.03肺萎陷。肺不张。0.07合并症患病率合并症患病率41焦虑症0.03脓毒症0.071原发性高血压0.36高血压0.530.03肿瘤性疾病中的贫血0.062高血压0.19恶性肿瘤史甲状腺新0.37阻塞性睡眠呼吸暂停综合征0.063个人烟草使用4甲状腺恶性肿瘤病史5食管癌X6术后甲状腺功能减退7II型糖尿病8收购0.17个人烟草使用0.280.03肾脏和输尿管0.05甲减9例单纯性高胆固醇血症II0.15食管扩张X0.19失败50蛋白质热量出血后贫血0.02胸痛10冠状动脉粥样硬化肺炎0.15营养不良11良性前列腺肥大0.12纯高胆0.15(0.35)、NRAS(0.32)和PRKAR1A(0.32)。基因的DisGeNET评分12肥胖0.12冠心病0.14疾病协会考虑来源的数量和类型(13烟草依赖0.1114贫血0.11动脉粥样硬化个人辐照低血钙0.140.13以及支持协会的出版物数量。 分数范围为0到1。我们还将我们的发现与癌症基因组图谱(TCGA)中筛选出的甲状腺癌基因进行了15心房颤动0.10心房颤动0.13程序. TCGA研究人员已经研究了乳头状ThyCa作为16慢性阻塞性0.10良性肥大0.12最常见的ThyCa类型(超过总ThyCa的85%)。TCGA肺疾病17前列研究人员在496名ThyCa患者的样本中发现,急性肾衰竭18大多数ThyCa是由与ThyCa相关的基因突变驱动的。充血性心力衰竭急性呼吸衰竭0.12丝裂原活化蛋白激酶(MAPK)信号通路:BRAF或19哮喘0.07肥胖0.1220低钾血症0.11RAS(NRAS,HRAS,KRAS)基因[15]。 TCGA研究人员发现新驱动基因:EIF1AX、PPM1D和CHEK 2 [15]。研究人员还21抑郁症0.06低渗透压/0.11观察到额外的基因(图)。(1)不具有统计学意义,22例低钾血症0.06低钠血症0.11但已知它们在ThyCa发病机制中起作用,例如:MLL,23长期使用急性肾功能衰竭ARID1B、PTEN、AKT、PPARG、TP53、RB1、NF、MEN1、TERT等。[第十五条]阿司匹林24阻塞性睡眠呼吸暂停250.06慢性阻塞性肺病0.10TCGA研究的发现减少了ThyCa病例的比例,虽然ThyCas的遗传驱动因素未知,但仍有至少3.5%的ThyCas需要遗传研究来发现遗传背景。我们文本低钙血症0.06心律失常0.1026使用BeFree工具挖掘PubMed,见补充资料脱水0.05充血性心脏失败0.09表S2. 我们提供了与ThyCa相关的504个基因的完整列表27慢性高血压0.05尿路感染0.08从PubMed中提取的基因可能有助于肾病28心律失常0.05蛋白质热量营养不良0.08ThyCa的出现在PubMed中发现BRAF基因与96种不同的29历史的故事合并症。它编码一种B-Raf蛋白,位于7号染色体的长臂上。在表5中,我们列出了与以下疾病相关的合并症:放射治疗30长期使用抗凝剂31非甲状腺性多结节性甲状腺肿在PubMed摘要中与BRAF基因相关RET基因与合并症之间的相关性见表6。RET基因位于10号染色体上,编码受体型酪氨酸激酶。与此相关的最常见的合并症32陈旧性心肌基因为多发性内分泌瘤[MEN] IIA型(DisGeNET评分梗死33放射治疗0.8),其次是ThyCa和多发性内分泌瘤[MEN]型睡眠呼吸暂停0.04胸腔积液0.0834尿路感染0.04哮喘0.08IIB(DisGeNET评分1)。35经皮冠状动脉成形术0.04高血压慢性肾病0.08NRAS基因位于1号染色体上,编码NRAS蛋白。在PubMed摘要中描述了与52种不同的36骨关节病0.04部分单侧声带麻痹0.07合并症。大多数NRAS与合并症之间的相关性发表在与急性髓性白血病的关系37慢性肾病0.04帘线长期服用阿司匹林0.07(52篇摘要,DisGeNET评分与NRAS基因相关的下一个最常见的疾病是未指明的白血病(19 ab-1)。38低渗透压和/0.04陈旧性心肌0.07皮肤恶性黑色素瘤(19例)、骨髓增生异常综合征或低钠血症39非甲状腺性单结节性甲状腺肿梗死0.04吞咽困难0.07KRAS基因位于12号染色体上,编码K-Ras蛋白。主要描述与胰腺癌的关系(1230.16高血脂0.2845甲状腺良性肿瘤0.03长期使用抗凝剂0.050.16术后0.2546胸痛0.03尿道炎由于0.050.16甲减获得性甲状腺功能减退0.2347冠状动脉粥样硬化0.03吸入焦虑0.05贫血0.2148恶性肿瘤史尼欧前列0.03慢性肾脏疾病0.040.15糖尿病类型0.2049急性呼吸0.02急性0.040.04听力损失0.080.04便秘0.080.04抑郁障碍0.080.04抗肿瘤0.08B. Ljubic等人医学信息学解锁25(2021)1006805表3ThyCa患者的合并症排名,年龄50岁及以下:男性(左)和女性(右)。显示了合并症的发生率(HCUP数据)。在41篇摘要中提及,在30篇摘要中提及PTEN;两种基因的DisGeNET评分均为0.1。使用DES系统生成的结果见补充材料表(见补充表S2)。50岁以下的男性50岁以下女性随着基因成为ThyCa发展的风险因素,基因检测越来越多地用于改善诊断和优化治疗。合并症患病率合并症患病率ThyCa患者的管理1原发性高血压贫血0.225. 讨论2贫血0.16恶性肿瘤史3甲状腺恶性肿瘤病史4术后甲状腺功能减退0.140.12原发性高血压低钾血症0.150.14在我们的研究中发现的合并症和基因可能对ThyCa具有潜在的流行病学,诊断,治疗和预后意义。Kuijpens及其同事强调了comor-binding作为影响ThyCa治疗和预后的危险因素的重要性。5烟草使用障碍0.12获得性0.13[16 ]第10段。 他们对378名患者的数据集进行了共现分析,6低钾血症0.117脱水0.10尿路感染0.120.11由荷兰埃因霍温癌症登记处提供。作者计算了几种常见合并症8获得性甲状腺功能减退症0.10脱水肿瘤性贫血0.10例如:其他恶性肿瘤、COPD、心血管和脑血管疾病、高血压、糖尿病和结核病。9低渗和/或烟草使用障碍Lee及其合作者研究了合并症在死亡率中的作用,低钠10食管癌X11单纯性高胆固醇血症0.09食管扩张X0.08术后甲状腺功能减退症0.080.08ThyCa患者的死亡原因[17]。该数据集包括来自单个机构的2070名患者。他们发现,有合并症的患者总体生存期较短,12糖尿病0.08肥胖0.08ThyCa以外的其他疾病引起的死亡Vissers和共同作者13肿瘤性贫血0.08纯0.07研究了合并症对ThyCa pa患者生活质量的影响疾病14高胆568例患者[18]。他们分析了最常见的comor-急性肾衰竭15发现44%的ThyCa患者有2个或更多个Hypertext 0.08个人历史照射0.06合并症。甲状腺疾病是最常见的合并症,16个人史0.07单次分娩0.06这群病人。照射17良性前列腺肥大活产缺铁性贫血0.06我们研究的目的是提供ThyCa合并症的患病率,并显示合并症如何随着进展而变化。18冠状动脉粥样硬化0.06恶心呕吐关于ThyCa我们也想展示一下流行率与性别有关,而不侧重于任何特定的共同因素,19房颤0.05低渗和/或0.05发病率疾病。我们的研究包括超过23,000 ThyCa pa-20尿路感染0.0521哮喘0.04低钠血症低钙血症0.050.04这与其他已发表的ThyCa研究不同,这些研究分析了来自加利福尼亚州474家医院的小得多的数据集,22慢性高血压糖尿病0.03主要是一家医院。这使我们能够研究ThyCa的患病率肾病23缺铁性贫血24慢性淋巴细胞性甲状腺炎0.03在更大规模的数据中,共病及其与ThyCa发展的演变,这使得我们的结果代表了整个加州的人口。两者中最常见的合并症肥胖0.03焦虑0.0325高血压为主要疾病,其次为少数疾病肺炎0.03蛋白质热量营养不良0.03对于患有甲状腺问题(甲状腺功能减退,26听力损失0.0327抑郁症0.02非甲状腺性多结节性甲状腺肿0.030.03ThyCa的历史等)。排名表上的大多数其他疾病与一般人群的发现相似,这可能是由于28慢性失血性贫血0.02高血脂慢性失血性贫血。0.03衰老的过程。Pozdeyev和同事最近分析了583名29例非X线单结节甲状腺肿300.02非甲状腺性单结节性甲状腺肿0.02晚期分化型和196例间变性ThyCas [27]。 他们报告BRAF(V600E)、TERT启动子和RAS突变,以及RETNontoX icmulti-哮喘0.02融合物 作为 的 最 常见遗传 的改变 乳头状甲状腺癌结节性甲状腺肿摘要)和结肠癌(103)。PRKAR 1A基因定位于17号染色体,编码c-AMP依赖性蛋白激酶。在PubMed中发现与34种疾病相关最常见的re-描述了库欣等如表7所示,10个或更多PubMed摘要中与ThyCa相关的20个基因的DisGeNET评分为0.1或更高,这表明这些基因与ThyCa之间的关联具有一定的显著性水平。在112篇PubMed摘要中,BRAF基因与ThyCa相关,其次是RET基因(55篇摘要)。这两个基因的DisGeNET评分都是0.4,并且已知与ThyCa有联系。SLC5A5基因编码一构件的钠-葡萄糖cotransporter这是包括TP53、MEN1、NF 1、NF 2、PIK3CA、PTEN、RBM10、ATM、BRCA 2和BRCA 1。在滤泡ThyCa样本中,最常见的遗传改变包括RAS、TERT启动子、TP53、RBM10和PTEN。BRAF V600E突变不太突出,滤泡ThyCa样本的一个子集在BRAF或RAS中没有突变,但表现出PTEN、TP53、RB1和MEN1突变的共存。间变性ThyCa还表现出TP 53、TERT、BRAF和RAS以及肿瘤抑制基因(包括TP 53、RB 1、NF 2和NF 1)和PI 3K/AKT途径基因(PIK 3CA和PTEN)的频繁遗传改变[27]。Pozdeyev及其同事的报告显示,通过DisGeNET鉴定的四个基因在ThyCa中经常发生遗传改变,除了PRKAR1A基因[27]。然而,由PRKAR1A突变引起的肿瘤易感性Carney综合征患者通常会发展为乳头状或滤泡状ThyCa。Pringle及其同事产生了ThyCa中PRKAR1A敲除的小鼠模型,并报告40%的动物模型在一岁时发展出滤泡ThyCa [28]。博泽和同事B. Ljubic等人医学信息学解锁25(2021)1006806表4在2篇或更多PubMed摘要中描述的与甲状腺癌相关的基因(154)AKT1EZH2ID1pik3CG叔Pax8MMRN 1ALKF9IGF1PPARGTGCXCR4SIRT1FASFGF2IGF1RPRKAR1ATGFB1CCDC6CBX7ATMFGFR2IL4MAPK1THBS1NCOA4HPGDSCCND1FHITCXCL8MAP2K1ThraRASAL1SGSM3BRAFFoxe1IL10MAP2K7THRBMADDTPCN1PTTG1IPFOXO3KDRTAS2R38TIMP1TP63公司简介CAV1FN1KRASPTCH1NKX2-1SOCS1TMPRSS4Runx2mTORLGALS3PTENSEC62TNFSF10NDRG2CD40Fuca1SMAD4NECTIN1TNFINPP4BSEMA6aCD44GABPAMMP2RAF1TP53PROM1ARHGAP 24Cdk5GOT2MUC1Rap1gapTP73PTTG1HTCDKN1AGSTM1MycRARBTPOSlit2PRIMA 1CDKN2AGSTM2NFE2L2RETTSHRBAG3CCDC80CCR6GSTP1NFKB1RPE65Twist1NR1D1DACT2CTNNB1GSTT1Notch1SDHDUVRAGYAP1MIR126CYP19A1HABP2NRAS嘘VDRTXNRD2MIR146ADUSP6HGFNTRK1SLC2A1VEGFATXNIPMIR197ECM1HIF1ASLC26A4SLC5A5VEGFCWDR3MIR21EGFHMGA1PIK3CASLC22A3VIMCKAP4MIR25EGFRHRAspik3CBSTAT3XRCC1RASSF1MIR146BEphB2TNCpik3CDTAF1XRCC3ZHX2KLLN表6RET基因与ThyCa合并症的相关性,3篇或3篇以上PubMed摘要。列出了描述RET与合并症之间关联的摘要数量,以及每种合并症的DisGeNET评分共病摘要数量DisGeNET评分多发性内分泌瘤[MEN] IIA3340.8甲状腺恶性肿瘤550.4IIB型多发性内分泌肿瘤431功能亢进160.2淋巴结130.1神经纤维瘤病1型110.1图 1. 二十 基因 最 经常发生突变, 患者 与 ThyCaTCGA数据。表54篇或更多PubMed摘要中与BRAF基因相关的ThyCa合并症。列出了描述BRAF与合并症之间相关性的摘要数量,以及每种合并症的DisGeNET评分。共病摘要数量DisGeNET评分甲状腺恶性肿瘤1120.4的结肠750.4皮肤恶性黑素瘤590.5淋巴结510.1白血病性网状内皮组织增生症500.6心内膜垫缺损130.2的卵巢130.6慢性淋巴细胞性甲状腺炎110.1脑肿瘤100.5继发性肺100.1细胞类型90.09多发性骨髓瘤90.49神经纤维瘤病1型80.38雷克林豪森继发性肝脏恶性肿瘤胰腺恶性肿瘤胃恶性肿瘤染色体异常4 0.04皮疹和其他非特异性皮疹4 0.04前列腺恶性肿瘤雷克林豪森神经内分泌肿瘤骨髓性白血病,急性7 0.07内分泌失调多发性内分泌肿瘤[MEN]I型原发性甲状旁腺功能亢进6 0.07慢性淋巴细胞性甲状腺炎帕金森氏甲状腺疾病胰腺恶性肿瘤风湿性关节炎3 0.03染色体异常3 0.03未特别指明细胞类型的白血病3 0.03非甲状腺结节性甲状腺肿3 0.02证 明 BRAF V600E 的 特 异 性 抑 制 剂 维 罗 非 尼 在 患 有 进 行 性 BRAF(V600E)阳性乳头状ThyCa的患者中诱导抗肿瘤活性[29]。Carr及其同事表明,舒尼替尼(一种靶向VEGFR、PDGFR、c-KIT、FLT 3和RET的酪氨酸激酶抑制剂)持续给药在碘难治性高分化ThyCa和中分化ThyCa患者中有效[30]。RET基因融合,CCDC 6-RET,经常在甲状腺癌和肺癌了解相关的合并症和基因对于ThyCa的治疗方案非常重要。然而,治疗的选择取决于个体患者中特定基因(如BRAF、VEGF受体、PET和RET/PTC、KDR、KIT和PDGFRA)的特定突变和其他因素的存在[31]。名单上的consid- 因此,应该扩大这些基因,这将有望增加预防和治疗的选择,并改善结果。我们在PubMed中发现了504个不同的基因,在DisGeNET中发现了5个与ThyCa相关的不同基因。如果我们考虑基因ThyCaB. Ljubic等人医学信息学解锁25(2021)1006807表710篇或更多PubMed摘要中与ThyCa相关的基因及其Dis-GeNET评分。基因PubMed摘要DisGeNET评分1BRAF1120.42RET550.43SLC5A5410.14PTEN300.15TG270.16TP53260.17TSHR170.18PIK3CA160.19PTCH1160.110PPARG130.111叔130.112VEGFA130.113CCDC6130.114AKT1120.115pik3CB120.116pik3CD120.117pik3CG120.118F9110.119TAS2R38110.120Pax8110.1在2个或更多的摘要中描述的相关性,在PubMed上发现的基因-甲状腺癌相关性比策划的来源多149个。如果在描述ThyCa和合并症的多个摘要中提到了某个基因,则可能表明ThyCa或合并症与该基因之间存在潜在关联。在PubMed摘要中发现的与ThyCa相关的基因需要遗传专家进一步评估,以确认其相关性。遗传学研究结果可以用来确定更多的人谁将受益于遗传学咨询。这将导致更好的基因检测指南质量,并早期发现可能增加ThyCa风险的研究的局限性:我们对PubMed摘要进行了文本挖掘。完整的文章包含更多的数据,有可能发现更多的基因。有时,与某些癌症相关的众所周知的基因在摘要中没有提到,仅分析摘要可能会导致遗漏一些列出的基因的发现。专家策划的来源。在我们的研究中,我们选择使用BeFree文本挖掘工具,该工具专门用于从生物医学文本中提取疾病,基因和药物之间的关系。其他专门用于生物医学数据的文本挖掘软件,如BioBERT,可能会产生稍微不同的结果。由于我们的文本挖掘项目是一个健壮的耗时过程,我们没有尝试使用不同的文本挖掘工具,我们不能得出结论,在不同的文本挖掘工具的情况下,文本挖掘的结果会有什么不同。通过文本挖掘技术获得的任何结果都需要专家验证,以确认提取结果的质量。另一个局限性是在选择数据库,我们使用作为我们的研究数据的来源。HCUP SID California数据库包含受加利福尼亚州风险因素,气候和环境因素影响的特定人群和疾病。其他地理区域的人群可能对最常见的合并症有不同的排名。由于我们纳入了数据集中登记的所有可能的合并症,不同地理区域之间合并症总数的变化可能很小,但不同人群之间最常见合并症的排名可能不同。此外,我们有HCUP数据集,其中包含研究时间为9年(2003-2011)。我们没有完整的患者病史,因此我们 无法 对 合并 症 的时 间轴 设 置任 何 限制 , 因为 我 们无 法知 道 患者在什么时候被诊断为ThyCa,合并症是否在诊断ThyCa之前或之后开始。如果我们在未来获得该数据集的额外年份,我们可以分析与ThyCa发育相关的6. 结论癌症疾病是复杂的,需要进一步研究作为风险因素的合并症和基因。PubMed(医学科学出版物的丰富资源)中积累的大数据的文本挖掘提取了基因与ThyCa和合并症之间的关联。我们的研究结果有助于更好地了解ThyCa的风险因素(基因、合并症)。预防,早期发现和治疗合并症可能会导致ThyCa更好的结果。更好地了解导致ThyCa的遗传变化可用于指导决策,以实现最佳,更个性化的ThyCa管理。仅在PubMed摘要中发现的与ThyCa相关的基因应作为这种癌症发展的潜在风险或预测因素进行评价。今后还需要对ThyCa进行更多的遗传和共病研究作者BL、MP、ZO、SR、AS、ME、VB、CVN设计了该项目。BL,MP,AS,ME,VB写的稿子。BL、MP、SR从HCUP搜索并下载数据。CVN,VB,AS,ME文本挖掘PubMed和DisGeNet。BL进行共构网络分析。BL、SR、VB、AS、ME和CVN完成基因-疾病关联分析。ZO进行了写作-审查和编辑。所有作者阅读并批准了最终手稿。竞合利益作者声明,他们没有已知的可能影响本文所报告工作致谢作者感谢阿卜杜拉国王科技大学(KAUST),赞助研究办公室(OSR)奖号OSR-2018-CPF-3657-03和FCC/1/1976- 24-01以及KAUST基线研究基金(BAS/1/1606-01-01)的支持。医疗保健研究和质量机构的医疗保健成本和利用项目(HCUP)提供了本研究中使用的数据本研究不需要伦理委员会的批准,因为我们使用了公开可用的数据集(HCUP),并且我们遵循了该特定数据库的使用附录A. 补充数据本 文 的 补 充 数 据 可 在 https : //doi 网 站 上 找 到 。org/10.1016/j.imu.2021.100680。引用[1] McDow AD,Pitt SC. MPHS.低危分化型甲状腺癌的外科治疗。外科临床2019;99(4):599
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++标准程序库:权威指南
- Java解惑:奇数判断误区与改进方法
- C++编程必读:20种设计模式详解与实战
- LM3S8962微控制器数据手册
- 51单片机C语言实战教程:从入门到精通
- Spring3.0权威指南:JavaEE6实战
- Win32多线程程序设计详解
- Lucene2.9.1开发全攻略:从环境配置到索引创建
- 内存虚拟硬盘技术:提升电脑速度的秘密武器
- Java操作数据库:保存与显示图片到数据库及页面
- ISO14001:2004环境管理体系要求详解
- ShopExV4.8二次开发详解
- 企业形象与产品推广一站式网站建设技术方案揭秘
- Shopex二次开发:触发器与控制器重定向技术详解
- FPGA开发实战指南:创新设计与进阶技巧
- ShopExV4.8二次开发入门:解决升级问题与功能扩展
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功