没有合适的资源?快使用搜索试试~ 我知道了~
大肠癌合并症网络分析及基因研究
医学信息学解锁21(2020)100492大肠癌的共病网络分析及遗传学研究作者:Branimir Ljubica,Martin Pavlovski a,Jumanah Alshehri a,Shoumik Roychoudhury a,Vladimir Bajicb,Christophe Van Neste b,c,Zoran Obradovica,*a美国宾夕法尼亚州费城天普大学数据分析和生物医学信息学中心(DABI)b阿卜杜拉国王科技大学计算生物科学研究中心,沙特阿拉伯图瓦尔c比利时根特大学医学遗传学中心(CMGG)A R T I C L EI N FO关键词:结直肠癌共病基因社交网络生物医学信息学A B S T R A C T背景:结直肠癌(CRC)是美国第三大常见癌症,也是癌症死亡的第二大原因。目的是确定与CRC相关的合并症和基因方法:在医疗保健成本和利用项目(HCUP)-加州住院患者数据库(SID)数据库上开发了一种新的社交网络模型来研究CRC的合并症。建立了合并症和合并症网络的分级列表,并计算了CRC不同阶段合并症的患病率。共病的排序列表用于PubMed和DisGeNET的文本挖掘,以提取与CRC相关的基因。结果:在CRC早期阶段,女性中确定了5,786例合并症,男性中确定了5,607例合并症,在晚期阶段,女性中确定了5,609例合并症,男性中确定了5,427例合并症。从PubMed中提取了1,937个不同基因与CRC之间的关联。DisGeNET中有150个基因与CRC相关。与CRC相关的最多的基因是:TP53(PubMed中的241篇摘要),APC(115)和KRAS(106)。这3个基因以及MLH1(98)和TGFBR2(18)的DisGeNET评分为0.5。PPARG基因(43)的DisGeNET评分为0.6。结论:合并症网络分析的结果提示哪些CRC合并症是高度预期的。发现的基因可以用来招募更多的人,这些人将从基因咨询中受益。合并症、CRC和共有基因之间的关联对CRC的早期发现和预后具有重要意义。预防和治疗发现的合并症可能会改善生活质量和CRC的结局1. 介绍在美国,每年有超过140,000例新病例和51,000例结直肠癌(CRC)死亡[1,2]。CRC是美国第三大常见癌症,也是癌症死亡的第二大原因[2]。它对男性和女性的影响几乎相同。CRC的发病率、死亡率和生存率存在地区差异,并随时间而变化[3]。CRC主要是发达国家的疾病,占所有病例的63%以上。在美国,每10万人中有40多人,在非洲和亚洲部分地区,每10万人中不到5人[3]。在美国,CRC的发病率正在逐渐下降,主要是由于癌症筛查和癌前息肉的早期检测。CRC生存率高度依赖于分期 早期癌症的5年生存率为90%,转移性癌症的5年生存率为10%[3]。近年来,CRC的治疗有了很大的改善更好的治疗方法延长了CRC患者的生存期[4]。CRC患者通常出现在年龄较大的人群中,伴有多种合并症。约59%的CRC患者有一种合并症,约19%的患者有4种或更多合并症[5]。除了社会人口统计学和癌症特征外,合并症也是影响CRC患者生存率的重要预后因素。早期识别和管理合并症有助于优化CRC患者的护理[6]。科摩罗网络分析有助于了解疾病进展[7提出了一种社会网络分析方法,用于表示2型糖尿病(T2DM)患者的心血管疾病(CVD)进展[10]。一个社交网络被开发出来帮助了解哪些合并症对T2DM进展的影响更大[8]。许多遗传网络是现成的[9]。Hidalgo和Barabasi描述了使用网络整合不同的遗传、蛋白质组和代谢数据集的可行路径* 通讯作者。Temple University,SERC 035-02,Center for Data Analytics and Biomedical Informatics,1925 N 12th St,Philadelphia,PA,19122,USA.电子邮件地址:Zoran. temple.edu(Z.Obradovic)。https://doi.org/10.1016/j.imu.2020.100492接收日期:2020年8月7日;接收日期:2020年11月16日;接受日期:2020年11月25日2020年12月1日网上发售2352-9148/©2020的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuB. Ljubic等人医学信息学解锁21(2020)1004922=ij≥=对阐明特定疾病的起源[7]。许多因素P=ni(一)提示对CRC有遗传贡献,如CRC或息肉家族史[11]。这是对基因的理解的一个重大扩展,我不Pi是患病率,ni是合并症患者的数量在过去的30年中发生了结肠癌[12美国 学院 的 医疗 遗传学 和Genomics 出版了评估CRC患者的指南,以确定其临床结果需要转介遗传学咨询的个体[15]。我们研究的目的是使用网络科学在HCUP SID California数据库中发现CRC不同阶段中最常见的合并症。我们使用发现的合并症来鉴定与CRC和合并症疾病相关的基因。使用文本挖掘工具BeFree从PubMed中提取CRC与基因之间的关系[16]。BeFree由基于模糊字典的生物医学命名实体识别(BioNER)模块组成,T是HCUP数据集中CRC患者的总数。为了构建互补网络,我们必须确定疾病间的共病关系强度。构造了基于φ-相关和基于相对风险(RR)的两种类型的协方差网络。这两个共同的措施被用来量化的强度之间的关系,这两个共同的,疾病[7]。计算每对最常见合并症之间的关系强度这些计算中不包括CRC。观察影响同一患者的一对疾病i和j的RR由以下公式给出:和模式匹配方法来找到和唯一地识别文献中提到的实体,以及基于支持向量机(SVM)的关系EX牵引(RE)模块[16]。RRCijNPiPj(二)我们研究的下一个目标是分析PubMed数据库中索引的摘要中CRC和合并症与基因之间的关联。确定共病和共有基因之间的关系对癌症的早期发现和结果我们认为基因和合并症是相互的-其中Cij是受两种疾病影响的患者数量,N是人群中的患者总数,Pi和Pj是疾病i和j的患病率。φ-相关性计算为:Cij N-Pi Pj相关的CRC风险因素PubMed文本挖掘的结果与来自专家策划来源的结果进行了比较我们使用了-φij= √̅P̅iP̅j (̅N̅-̅P̅ i)(N-̅P̅j)(三)GeNET作为专家源验证PubMed的文本挖掘结果。这是与人类疾病有关的基因的最大集合之一。DisGeNET整合了来自专家管理的数据库、GWAS目录、动物模型和科学出版物的数据[17]。2. 材料和方法我们对HCUP,SID加利福尼亚住院患者数据库(ICD-9/10代码格式)中与CRC相关的合并症进行了分析,该数据库包括了2009年最大的纵向出院数据集。美国[18]。 我们分析了9年(2003-2011)的数据。这一时期疾病以ICD-9编码表示。我们使用ICD-9编码153和154来指定CRC的存在。创建SQL查询和Python代码以提取CRC合并症。我们在这个链接上分享我们的Python代码:https://github.com/martinpavlovski/cancer-comorbidity-analysis。我们分别完成了对50岁以上患者和50岁以下患者的分析。在50岁以上的患者组中,下载与CRC相关的合并症并分为2组。我们纳入了所有患有CRC但未诊断为早期癌症转移的患者和已诊断为晚期癌症转移的患者。 我们使用ICD-9编码196、197和198来指定转移酶的存在。HCUP数据库仅包含CRC的诊断而没有TNM分期的说明,并且它包含关于转移的存在的信息,这将我们的合并症分析限制为两组:无和有诊断的转移。我们不能通过TNM分期系统分析CRC和合并症,因为HCUP数据库中不包含这些信息。对于年龄在50岁及以下的患者组,在研究期间,HCUP数据库中确定的患者数量相对较少,我们couldn’t味觉我们分别计算了该年龄组男性和女性的合并症在50岁以上的患者组中,分别分析了早期和晚期CRC的数据,并分别分析了男性和女性的数据。我们的全面方法包括建立排序列表 的 合并症使用 频率 它们的出现,RR高估了涉及罕见疾病的关系,低估了高度流行的合并症。φ-相关性高估了相似患病率疾病之间的合并症,但低估了罕见疾病之间的合并症[7]。我们构造了两种类型的网络,分别为每个措施。 无论是模型中,来自秩列表的前100个共病被用于构造邻接矩阵XA[ij],其编码一对节点是否连接以及如何连接。仅1例患者存在早期阶段女性中86%的合并症和男性中87%的合并症,以及晚期CRC中女性中84%的合并症和男性中85%的合并症。如果30,000名患者中只有1名患者出现这种疾病,则很难将任何疾病视为CRC的合并症。我们选择在我们的网络分析中涉及约5%诊断为CRC的患者中出现的合并症,结果表明在每个实验环境中约有100名患者。 我们创建了一个幂律网络。一Kolmogorov–Smirnov是为了确定网络是否遵循幂律。我们从邻接矩阵X构建了一个有符号的相关网络,并对相关性进行了幂变换(归一化)[19]。对于规范化,我们使用带符号的网络规范化|(corMatri X+1)/2|对于100 × 100邻接矩阵X.通过将相关性的绝对值提高到β1次方(软阈值),符号相关网络强调更高的相关性,而不是更低的相关性。我们测试了1到10之间的β值,并为φ选择β=2相关性和β五是RR。选择这些β值是因为它们提供最佳的网络可视化。我们使用变换(归一化)后的相关矩阵X作为相邻矩阵来绘制网络。共构网络采用WGCNA、Statnet和ggplot2软件包,用R语言编程构建。计算中心性度量(节点度和介数)以分析每个共病的显著性。网络中合并症的重要性由其节点度或介数来表征。节点度表示节点到网络中其他节点的链接数量。介数是通过节点的最短路径的数量。我们使用以下公式计算介数[20]。合并症患病率分析,合并症g(v)=∑σst(v)(四)网络,并计算中心性指标,以估计合并症的显著性。我们使用以下公式计算s=scinvscinv=tσstCRC合并症的发生率其中g(v)是节点v的介数,σst是B. Ljubic等人医学信息学解锁21(2020)1004923从节点s到节点t的最短路径,σst(v)是通过v的路径的个数。此外,我们利用PubMed文本挖掘的CRC合并症排名列表,以确定与CRC和合并症相关的基因。利用BeFree文本挖掘系统,通过使用文本的形态句法信息来提取CRC、排名的共病和基因之间的关联。我们还提取了-来自专家策划来源的基因和疾病之间的关系(DisGeNET)。表150岁以上女性CRC早期和晚期的合并症。1a:早期发生分级合并症。1b:分级合并症发生在晚期CRC。显示了合并症的发生率。1a和1b女性-早期女性-晚期诊断患病率我们比较了基因-共病关联的比例,1 Essential0.63基本0.60在PubMed中发现,数据收集在DisGeNET中。基因大多数高血压2高血压通常与CRC相关,贫血0.33高血压0.413从排行榜中剔除合并症PubMed中的摘要数量Hypertension 0.32个人历史烟草使用0.38对这些关联进行了统计。数字列表4恶性肿瘤史0.30恶性肿瘤史0.33的PubMed摘要显示了六个最常见的大肠新生儿5大肠新生儿CRC的基因和合并症被创建,以显示尿路感染0.26贫血0.336这些协会。低钾血症0.24糖尿病类型II0.277糖尿病型0.23冠状动脉0.263. 结果3.1. 共现分析II8食管癌X9个人烟草使用粥样硬化麻痹性肠梗阻心房纤颤10甲状腺功能减退症0.20充血性心脏病0.22在50岁以上的患者组中,HCUP SID California数据库(2003-2011年)中的早期女性患者总数11充血性心力衰竭0.19食管破裂X0.21CRC分期为31,503,男性为30,870。总人数-晚期CRC患者为:女性12麻痹性肠梗阻0.19甲状腺功能减退0.2013急性肾衰竭0.1927,454. 我们对早期乳腺癌患者的合并症进行了分析,14冠状0.18纯0.18CRC阶段,并确定了5,786种不同的合并症,粥样硬化15高胆女性和男性5,607人在晚期CRC患者脱水0.17消化系统0.18我们在女性中发现了5,609种不同的合并症,在男性中发现了5,427种。一些最常见的并发症是特定于16结肠憩室病0.17慢性气道阻塞0.17CRC患者,但大多数情况与一般17纯低钾血症人口表1显示了年龄大于50岁的女性,高胆18无路径骨质疏松症。骨折0.16脱水0.16CRC的早期阶段(表1a)和晚期阶段(表1b)。的表中还显示了根据以下疾病的特定合并症的患病率:19尿路感染0.1620肺炎0.14肺炎0.15HCUP数据。 在两个阶段中排名第一的综合评分是Essential21低渗血症和/或结肠憩室0.14 0.15高血压,在两个阶段的患病率非常相似。高脂血症、恶性疾病史、贫血、2型糖尿病、冠状动脉硬化、麻痹性肠梗阻、营养不良、急性肾功能衰竭低钠22急性出血后贫血烟草使用障碍疾病,姑息治疗的遭遇,缺乏大或小的部分,23缺铁0.14慢性高血压小肠在晚期癌症中的患病率比早期癌症高出几个百分点,这可以归因于贫血24慢性气道阻塞肾病0.14结肠良性肿瘤0.15变老在表2中,我们列出了男性CRC合并症的排名,25急性肾功能衰竭出血后0.14早期(表2a)和晚期(表2b)。在癌症的两个阶段中,最常见的合并症是原发性高血压,26超重、肥胖0.14贫血陈旧性心肌0.14与女性患者相同。在这两个阶段,女性和男性的患病率相似,在0.58和0.59之间变化。27缺铁血虚0.14梗死超重肥胖0.140.63. 贫血、吸烟史、高脂血症、冠状动脉粥样硬化-风湿性关节炎、充血性心力衰竭、心房颤动和其他心脏病-损失28抑郁症0.13低渗和/或0.14食管节律你好,历史的恶性的肿瘤29消化系统0.13低钠0.14前列腺癌、肺癌、结肠癌和其他癌症、急性肾衰竭、脱水、结肠造口术状态、肺炎和急性呼吸衰竭更常发生在晚期CRC中。我们可以注意到,大多数疾病在晚期阶段的患病率比CRC的早期阶段高几个点,这可以通过衰老和并发症30例结肠良性肿瘤心脏节律障碍0.12失血性贫血0.14CRC的进展在表3中,我们分别列出了男性(3a)和女性(3b)的CRC合并症及其在50岁及以下患者中的患病率。在这个年龄组中,我们确定了3794例男性CRC患者和3640例女性患者。在研究期间,HCUP在该年龄组中包含极少数无转移的患者,因此我们一起分析了所有患者,而不考虑转移。该年龄组的男性原发性高血压、烟草使用障碍、高脂血症、糖尿病和败血症的患病率高于女性。对女性患者贫血、低钾血症、尿路感染、肥胖、抑郁症的患病率高于男性患者。3.2. 科摩罗网络为年龄大于50岁的患者构建了共同网络,分别针对早期和晚期CRC,男性和女性。B. Ljubic等人医学信息学解锁21(2020)1004924表250岁以上男性CRC早期和晚期的合并症。2a:早期发生分级合并症。2b:分级合并症发生在晚期CRC。显示了合并症的发生率表3年龄50岁及以下的CRC患者的合并症排名:男性(3a)和女性(3b)。显示了合并症的发生率3a和3b503大肠恶性新生儿病史4个人烟草使用5高血脂烟草使用8个人历史0.15肿瘤性贫血0.152型糖尿病的治疗方法0.25直肠恶性肿瘤疾病2型糖尿病的治疗急性肾功能衰竭9低渗血症和/或低钠血症烟草使用障碍8麻痹性肠梗阻0.24脱水0.2510食管癌X0.14食管扩张X0.149脱水0.20慢性气道阻塞0.2411结肠造口状态0.14获得性缺失肠(大,小)0.1410低钾血症0.19冠状动脉0.2412糖尿病0.14肥胖0.1411低渗血症和/或低钠血症粥样硬化烟草使用障碍13肿瘤性贫血0.14直肠恶性肿瘤病史0.1412例食管癌X0.18低渗透压和/或0.2014急性肾衰竭0.14抑郁症0.14低钠13结肠憩室病0.18尿路感染0.2015 Hyper 0.14个人历史照射0.1314邂逅姑息治疗心房纤颤16个人辐射0.13腹膜粘连15急性肾衰竭0.17低钾血症0.1817、缺席缺席0.12缺铁0.1316慢性气道0.16食管扩张X0.18肠(大,小)贫血梗阻18例腹膜粘连0.12恶心呕吐0.1317结肠良性肿瘤18前列腺肥大(良性)19肿瘤性贫血0.16充血性心力衰竭0.16姑息治疗0.15肿瘤性贫血0.170.170.1719肠梗阻0.12低渗和/或低钠营养不良0.12疾病20充血性心力衰竭疾病0.15前列腺恶性肿瘤0.1622例 术后伤口感染糖尿病的治疗方法21附0.14未指明蛋白质-热量营养不良22辐射,对健康造成危害0.14支气管和肺急性呼吸衰竭纯0.1628慢性失血性贫血0.10慢性失血性贫血。0.10高胆固醇血症,浓度0.1529腹泻0.10消化道恶性肿瘤家族史0.10失败冠状动脉粥样硬化0.11辐射,对健康造成危害前列腺肥大(良性)0.150.1530败血症0.10哮喘0.10(UTI)-65、充血性心力衰竭(CHF)-63、冠状动脉疾病(CAD)-52、贫血-50和急性肾衰竭(AKF)-49。在网络1a中具有最高中间性的合并症是:UTI-329,CHF- 275, CAD-254, 结肠造口术 状态-248,贫血-153, 和脱水-140.基于RR测量,网络1b中具有最高节点度的合并症为:贫血-61、阻塞性慢性支气管炎(OCB)-57、低氧血症-56、高钾血症-55和外周血管疾病(PVD)-53。以下条件具有最高的介数女性节点表示疾病(合并症),并且链路根据上述距离测量来连接合并症(RR,φ-相关性)。计算的节点度和介数显示了最多的在八个网络中的每一个中连接(显著)共病。在图1中,我们展示了女性CRC早期阶段的两个网络。考虑到φ-相关性,网络中的最高节点度1a:尿路感染在网络1b中:术后感染-301,结肠造口术状态-263,胃肠炎-256,胸痛-242和OCB-221。图 图2显示了两个网络(φ-相关性和RR),用于高级女性CRC分期网络2a中具有最高节点程度的合并症(φ-相关性)为:UTI-57、贫血-52、CHF-47和低钾血症-40。最高的 中间值是:UTI-467,贫血-437,脱水-420,2a男性患病率2b男性患病率1年龄小于50诊断患病率基本0.32年轻女性诊断贫血比流行率0.321原发性0.60原发性0.58高血压高血压高血压2贫血0.28恶性肿瘤史2贫血0.34恶性肿瘤史大肠0.38大肠癌3例恶性0.27基本0.270.31贫血0.374大肠新生麻痹性肠梗阻0.22高血压低血钾0.230.30 Hyperbodies0.3356烟草使用障碍低血钾0.210.17麻痹性肠梗阻0.21尿路感染0.200.29个人经历0.327脱水0.16脱水0.1820尿路感染0.11便秘0.1221蛋白质-卡路里0.11肠梗阻0.1223烟草使用障碍0.1324未指明蛋白质-0.13热量营养不良25其他术后感染26房颤0.130.1227例急性呼吸道疾病0.1223缺铁0.11结肠造口术状态0.110.16贫血24肥胖0.10焦虑0.110.1625肺炎0.10蛋白质-热量营养不良0.1026听力损失0.10腹泻0.100.1627便秘0.10高血脂0.1028纯0.12听力损失0.15高胆29肺炎0.15尿路感染0.11前列腺恶性肿瘤病史0.14B. Ljubic等人医学信息学解锁21(2020)1004925Fig. 1. 50岁以上女性CRC早期合并症网络共患病网络,基于:a)φ-相关性和b)女性RR。 节点代表前100种合并症(ICD 9代码)。相关系数大于0.32(β= 2)和RR大于5.99(β= 5)用于构建的边缘。图二. 50岁以上女性晚期CRC合并症网络共患病网络,基于:a)φ-相关性和b)女性RR。节点代表前100种合并症(ICD 9代码)。应用大于0.30(β= 2)的相关性和大于8.99(β= 5)的RR来构建边缘。放疗史405例,麻痹性肠梗阻329例。考虑到RR测量,网络2b中的最高节点度为:慢性肾脏疾病-56,下背部压力性溃疡-50,高血压慢性肾脏疾病-48,高钾血症-42,脓毒症-42和长期使用胰岛素-41。网络2b中的最高介数为:慢性肾病-494、OCB-421、化疗史-368和低氧血症-307。接下来,我们展示了两个用于男性CRC早期阶段的网络(图3)。我们使用了与女性相同的指标,图3a中的φ-相关性和图3a中的RR-相关性。 3 B.网络3a中具有最高节点度的合并症(φ-相关性)为:CHF-64、AKF-59、贫血-57、UTI-55和CAD-50。网络3a中的最高介数为:UTI-492,贫血-431,CHF-394,AKF-350和听力损失-277。中的最高节点度图三. 50岁以上男性CRC早期合并症网络协方差网络,基于:a)φ-相关性和b)RR。节点代表前100种合并症(ICD 9代码)。边缘的相关性大于0.32(β=2),RR大于8.99(β= 5)B. Ljubic等人医学信息学解锁21(2020)1004926网络3b(RR)是:贫血-63、高钾血症-60、OCB-58、慢性肾病-55、原发性心肌病-55、PVD-53和败血症-50。网络3b中的最高介数是:结肠造口术状态-418,贫血-294和术后感染-267。我们为男性晚期CRC创建了两个网络(图4)。我们使用了与女性相同的指标,φ-相关性(图4a)和RR(图4 b)。 4 b)。在网络4a中具有最高节点度的条件(φ-相关性)是:贫血-49、CHF-48、AKF-44和CAD-37。网络4a中的最高介数:贫血-414,脱水-401,CHF-386,AKF-310,UTI-301和蛋白质-热量营养不良-287。网络4 b(RR)中的最高节点程度:原发性心肌病-42,慢性肾脏疾病-40,PVD-39和持续性精神障碍-39。网络4 b中的最高介数:吞咽困难-480,原发性心肌病-410,OCB-384,低氧血症- 294,以及不复苏状态-293。3.3. 与CRC和合并症CRC合并症的排名列表用于PubMed和专家策划来源的文本挖掘,特别是DisGeNET,这是一个全面的 平台 整合 信息 对 人类疾病-相关基因 BeFree文本挖掘系统应用于表4APC基因与CRC和合并症相关。提供了PubMed中在3篇或3篇以上摘要中描述这些关联的摘要数量。无疾病PubMed摘要1胃恶性肿瘤2前列腺恶性肿瘤3淀粉样变性154Barrett5胰腺恶性肿瘤6公元6年7卵巢恶性肿瘤8食管恶性肿瘤9膀胱恶性肿瘤10脑肿瘤411部位未特指的肠道恶性肿瘤412系统性红斑狼疮13溃疡性结肠炎414风湿性关节炎315伯基特16巨核细胞白血病3型17败血症318低丙种球蛋白血症319糖尿病3型20皮脂腺囊肿321移植物抗宿主病提取基因、合并症和CRC之间的关联,22继发性和未特别指明的淋巴恶性肿瘤3PubMed.PubMed索引了超过170,000篇关于CRC的出版物(MeSH主要主题搜索)。Befree数据挖掘系统提取了1937个节点23口腔溃疡与PubMed中CRC相关的不同基因。(The我们在DisGeNET中发现了150个与CRC相关的不同基因。 两个来源中都有96个X基因。 大多数gen-e–CRC(1160)。最常提及的与CRC相关的基因是:TP53(PubMed中的241篇摘要),APC(115)和KRAS(106)。所有3个基因的DisGeNET评分均为0.5。基因-疾病关联的DisGeNET评分考虑了来源的数量和类型(策展水平)以及支持该关联的出版物数量。分数范围为0到1。另外两个基因的DisGeNET评分为0.5:MLH1(98篇摘要)和TGFBR2(18)。其中一个基因(PPARG)的DisGeNET评分为0.6,在PubMed摘要中被提及43次。在表4中,我们提出了APC基因与comor的相关性。CRC的biditiesAPC基因位于染色体长臂上5. 该基因发出APC蛋白(一种肿瘤抑制剂)产生的信号,该蛋白减缓细胞的生长和分裂,并控制细胞如何附着和移动[21]。APC基因的突变已经被与几种癌症相关,包括家族性腺瘤性息肉,Osis和CRC。APC基因也在良性硬纤维瘤、原发性肾上腺大结节增生、Turcot综合征、脑肿瘤(髓母细胞瘤)、胃(胃)癌、前列腺癌等患者中有描述。我们对PubMed的文本挖掘提取了这些肿瘤以及与APC基因相关的几种白血病。BeFree文本挖掘系统还提取了一些合并症,如淀粉样变性、AD、系统性红斑狼疮、糖尿病,以及与APC基因潜在相关的其他一些疾病。TP53基因位于17号染色体的短臂上。TP53基因调节蛋白质p53的产生,p53是一种肿瘤抑制因子,可防止细胞在不受控制的情况下生长和分裂[22]。TP53基因突变是人类癌症中最常见的遗传TP53基因中的突变与发生乳腺癌、膀胱癌、胆管癌、鳞状细胞癌、骨癌、肉瘤、肺癌、黑素瘤、CRC等的风险相关。见图4。50岁以上男性晚期CRC合并症网络协方差网络,基于:a)φ-相关性和b)RR。节点代表前100种合并症(ICD 9代码)。对于边缘,使用大于0.30(β=2)的相关性和大于8.99(β= 5)的RRB. Ljubic等人医学信息学解锁21(2020)1004927我们的文本挖掘结果包含上述肿瘤,以及几种白血病还描述了与该基因相关的几种合并症,例如:霍奇金病、溃疡性结肠炎、类风湿性关节炎、阿尔茨海默病等。CRC和与基因TP 53相关的合并症之间的关联显示在表5中。KRAS基因位于12号染色体的短臂上。它调节K-Ras蛋白的合成[23]。KRAS基因突变与自身免疫性淋巴增生综合征、胆管癌、急性髓性白血病、表皮痣、肺癌、胰腺癌、CRC以及诸如智力残疾、独特面部特征、身材矮小、大头畸形、心脏缺陷、皮肤异常、努南综合征等病症相关。在表6中,列出了CRC、KRAS基因和合并症之间的关联。PubMed的文本挖掘提取了KRAS基因与多种肿瘤(主要是胰腺癌)和几种非肿瘤性疾病的关联。还提取了与未指明的病毒性丙型肝炎、慢性胰腺炎、溃疡性结肠炎、登革热、房性早搏、子宫内膜异位症等相关的KRAS基因。MLH1基因位于3号染色体的短臂上的MLH1基因编码一种在修复DNA错误中起关键作用的蛋白质[24]。MLH1基因突变与体质性错配修复缺陷综合征、CRC、脑癌、白血病、淋巴瘤、Lynch综合征、1型神经纤维瘤病、子宫内膜癌、卵巢癌、胃癌等相关。表7列出了PubMed摘要中发现的CRC、MLH1基因和合并症之间的相关性TGFBR2基因位于3号染色体的短臂上。它编码转化生长因子-β(TGF-β)受体2型,该受体可传递阻止细胞生长和分裂过快的信号[25]. TGFBR2基因的突变 中发现马凡氏综合征(家族性胸主动脉表5与CRC和合并症相关的TP53基因。提供了PubMed中的摘要数量,其中这些关联在20篇或更多摘要中描述。无疾病PubMed摘要1前列腺恶性肿瘤2慢性类白血病2483卵巢恶性肿瘤4急性髓系白血病5胃恶性肿瘤6膀胱恶性肿瘤7胰腺恶性肿瘤8子宫颈恶性肿瘤1309未特别指明细胞类型的白血病11210脑肿瘤8711继发性和未特别指明的淋巴8212节点未特别指明的骨髓增生异常综合征7613食管恶性肿瘤7614多发性骨髓瘤6815慢性髓样白血病6216伯基特5317急性类白血病5118未特别指明的口腔恶性肿瘤5119霍奇金5020Barrett3821溃疡性结肠炎3622继发性肝恶性肿瘤3123套细胞淋巴瘤2924类风湿性关节炎2925性肝脏2726甲状腺恶性肿瘤2727光化性角化2528未特别指明的丙型2329细胞类型未特别指明的急性2230神经纤维瘤病,1型[冯雷克林豪森2131阿尔茨海默20表6与CRC和合并症相关的KRAS基因。提供了PubMed中的摘要数量,其中在4篇或更多摘要中描述了这些关联。没有疾病PubMed摘要1胰腺恶性肿瘤1232继发性肝恶性肿瘤273胃恶性肿瘤264未特别指明的丙型255的卵巢176继发性肺147继发性和未特别指明的淋巴14节点8例急性骨髓性白血病109前列腺恶性肿瘤8慢性胰腺炎711例动脉导管未闭7溃疡性结肠炎713登革热614例房性早搏5子宫内膜异位症516例细胞类型517甲状腺恶性肿瘤518部位未特指的胆道恶性肿瘤519例多发性骨髓瘤520例胸腔积液421例子宫平滑肌瘤422例急性类白血病4表7MLH1基因与CRC和合并症相关。提供了PubMed中在3篇或3篇以上摘要中描述这些关联的摘要数量。没有疾病PubMed摘要1胃恶性肿瘤382的卵巢243细胞类型104膀胱恶性肿瘤75的前列腺76溃疡性结肠炎67继发性和未特别指明的淋巴5节点8vonRecklinghausen9亨廷顿10结节性淋巴瘤311部位未特指的子宫恶性肿瘤312胰腺恶性肿瘤13子宫内膜增生伴子宫内膜异位症3解剖),Loeys-Dietz综合征II型,各种癌症(CRC和其他)。我们对PubMed的文本挖掘发现了除了阿尔茨海默病、哮喘、溃疡性结肠炎等之外的这些疾病PPARG基因位于3号染色体的短臂上。该基因编码核受体的过氧化物酶体增殖物激活受体(PPAR)亚家族[26]。PPARs参与了许多疾病的病理学,包括肥胖症、动脉粥样硬化、前列腺癌、脂肪代谢障碍、神经胶质瘤、肥胖症、胰岛素抵抗、糖尿病、血脂异常、高血压和CRC。我们的文本挖掘结果符合这一描述。在表9中,我们显示了CRC、PPARG基因和合并症之间的关联。在表10中,我们列出了在PubMed和DisGeNET两个来源中鉴定的96个基因。4. 讨论慢性疾病等作为CRC是关联与许多B. Ljubic等人医学信息学解锁21(2020)1004928表8与CRC和合并症相关的TGFBR2基因 提供了PubMed中的摘要数量,其中在2篇或更多摘要中描述了这些关联。无疾病PubMed摘要1马凡2胃恶性肿瘤3前列腺恶性肿瘤4胰腺恶性肿瘤5动脉瘤46阿尔茨海默7哮喘28溃疡性结肠炎29动脉导管未闭210Ehlers-Danlos综合征211系统性硬化症212偏头痛213未特别指明的口腔恶性肿瘤214胆囊恶性肿瘤15部位未特指的主动脉夹层合并症和并发症,影响生活质量和CRC的预后某些合并症(痴呆、抑郁症、酒精中毒)与CRC诊断延迟相关,而一些需要频繁医疗护理的慢性合并症(T2DM、CVD、高血压)与CRC早期检测相关[6,27]。合并症患者通常接受与无合并症患者不同的CRC治疗(手术、化疗、放疗)[6,27]。大多数已发表的研究提出了社会网络方法,包括多种疾病(表型),而不是专注于任何特定疾病作为主要主题[7,28,29]。在我们的研究中,我们对一种疾病(CRC)的合并症进行了社会网络分析。这种癌症大多在年龄较大时被诊断出来,此时通常存在合并症,并且它们可能是CRC的重要风险和预后因素。我们对CRC合并症的患病率和网络分析显示,哪些特定的合并症更普遍和更重要。我们的研究结果可以在医学上有实际的实施,通过提供关于哪些合并症的信息,bidity 条件应该 被看 为作为高度 预计,和16淋巴结继发性和未特别指明的恶性肿瘤表9因此被预防或治疗。我们的研究结果表明,某些特征性的合并症,如结肠憩室病、肠道恶性肿瘤史、肠道良性肿瘤、麻痹性肠梗阻等,在结直肠癌中的患病率较高PubMed上与CRC和合并症相关的PPARG基因。在10篇或更多摘要中给出了与CRC和PPARG相关的合并症。无疾病PubMed摘要1肥胖症2082糖尿病1003运动员374代谢异常综合征x 355阿尔茨海默6前列腺恶性肿瘤7高血压病318心力衰竭279亨廷顿10多囊卵巢1711冠状动脉粥样硬化1412脂肪代谢障碍1413甲状腺恶性肿瘤14心血管疾病1215糖尿病视网膜病变1216胃恶性肿瘤17糖尿病与肾脏表现11比一般人多。比较年龄小于或大于50岁的患者组之间的结果,我们可以注意到年龄小于50岁的患者的原发性高血压患病率显著低于年龄大于50岁的患者。 年轻的爸爸们--他们硬化症、充血性心力衰竭、心房颤动和其他心律失常,在前30位合并症中。他们也没有前列腺、肺、结肠和其他癌症的恶性肿瘤史,这些癌症在前30位最常见的合并症中。这些结果表明,许多合并症受患者年龄的影响。某些合并症,如大肠和直肠恶性肿瘤史,麻痹性肠梗阻,肠梗阻,结肠造口术状态和腹膜粘连存在于两组中,年龄小于50岁和大于50岁,这证实了一些合并症受CRC发展的影响。构建的无标度网络和计算的中心性指标表明,合并症之间的相互联系超出了简单的巧合[7,28]。中心性度量(节点度,介数)发现存在高度关联的合并症(枢纽),18骨关节病,未特别指明是否全身性或11图 一比四 高度相关的合并症,如CHF、CAD、OCB,局部19帕金森CKD、AKF、贫血、低氧血症和其他一些疾病应随访,20肌萎缩侧索硬化症1021胰腺恶性肿瘤表1096个与CRC相关的基因,存在于两个来源:PubMed和DisGeNET。ALDH1B1 CHEK2 IGF2 MTHFR PTP4A3SULT1A1 ALOX5 CTNNB1 IL1B MUTYHPTPN12 TAGLN APC CXCL10 IL32 MYC PTPRJ TCF7L2 ASCL2 DMBT1 JUN NDRG2RAD54B TGFBR2 ATP7A DNMT1 KCNH2 NFKB 1 RCOR 1 TNFAXIN2 DPYD KDM1A NOS2 RECKTNFRSF10A BAX EGFR KRAS NOTCH1 S100A4TNFSF10 BCL 2 ERBB2 LEF1 NOX1 SERPINB5 TP53 BECN 1 FBP1 LEP NOX4SERTAD1 TP63BIRC 5 GAST LGR 5 ODC 1 SLC2A1 TPM 3 BRAF GCG MCM2 PCNA SLC5A8TYMP BRD 4 HES 1 MECOM POLB SLCO 1B3 TYMS CBR 1 HMGCS 2 MIR98PPARG SOD2VEGFA CCAT 1 HSPB 1 MLH 1 PRKN WT1 CCND 1 ICAM 1 MMP 7PROM1 SRC XAF 1 CDKN 1A IFNG MMP 9PTGS2STAT3YBX1治疗。RR度量揭示的一些重要条件是: 贫血, 低氧血症, 结肠造口术状态, 胸胃炎疼痛、压迫性溃疡-下背部、高钾血症、败血症等。φ相关显示了高度普遍和预期的合并症。中心性指标的评价发现,考虑到与CRC相关的最显著合并症的合并症研究的结果用于分析基因、CRC和合并症之间的关联。我们在PubMed上比在Dis上多提取了627个基因(在2个或更多摘要中描述)Genet.遗传学研究结果可以用来招募更多的人谁将受益于基因检测和咨询[13最近的研究除了基因组数据外还纳入了合并症,以确定新的疾病-基因关联[9,10,28,29]。如果相同的基因这通常表明这两种疾病有共同的遗传起源。大数据的Comorbian网络和文本挖掘(如PubMed)可以帮助发现以前未知的与CRC相关的基因[29]。CRC是多种基因突变的累积效应。在表4中,我们列出了APC基因与CRC和合并症的相关性。APC基因突变导致家族性腺瘤性息肉病和遗传性非息肉病性CRC [30]。APC基因的突变发挥了B. Ljubic等人医学信息学解锁21(2020)1004929在CRC发病机制中起关键作用。APC成为CRC中最常突变的已知驱动基因之
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功