糖尿病黄斑水肿的统计学方法预测及高阶上位性相互作用检测

137 浏览量更新于2024-01-07 收藏 1.69MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

医学信息学解锁20（2020）100362高阶上位性相互作用检测预测糖尿病黄斑水肿的统计学方法G. Rajesh a，X. Mercilin Raajini b，K. Martin Sagayam c，Hien Dangd，e，*a印度钦奈安娜大学麻省理工学院信息技术系b印度Prince Shri VenkateshwaraPadmavathy工程学院欧洲经委会系c印度泰米尔纳德邦哥印拜陀Karunya技术和科学学院d越南Thuyloi大学计算机科学与工程学院电子计算机科学系，麻省大学波士顿分校，MA，美国A R T I C L EI N FO保留字：糖尿病性黄斑水肿单核苷酸多态性（SNP）糖尿病糖尿病视网膜病变机器学习SVMKNNA B S T R A C T糖尿病性黄斑水肿（diabetic macular edema，DME）是一种常见的威胁视力丧失的疾病，它是由于黄斑中的液体积聚而引起的，黄斑是视网膜的重要部分，控制着最特定的视力。上位性是一个基因（不是等位基因）的表型效应被另一个基因（即）所掩盖。其中一个基因的影响取决于一个或多个修饰基因的存在。上位学习的目的是检测多个单核苷酸多态性（SNP）和复杂疾病之间的关联。上位相互作用的检测有助于在所用DME数据集中检测糖尿病视网膜病变。本文提出了一种利用统计方法如对称不确定性、相互作用权重因子和相互作用增益检测上位性相互作用的方法，并与其他预测方法如FHSA-CED、EACO和MACOED以及两种机器学习技术支持向量机（SVM）和k-近邻（kNN）进行了比较。该方法有助于早期预测视网膜功能障碍，防止视力下降。通过分析上位相互作用预测糖尿病视网膜病变症状，并使用统计方法以最小化计算复杂度检测高阶上位相互作用。所提出的方法的召回率和精度值分别为99和73.880。与现有方法相比，准确性和F1得分的分析分别为99.99%和84.615%。实验结果表明，该方法具有较好的检测高阶上位相互作用的能力，且计算复杂度较低。1. 介绍糖尿病是当人体的血糖过高时发生的最严重的问题。随着时间的推移，血液中的高葡萄糖水平会导致健康问题。糖尿病分为1型、2型和妊娠期糖尿病。据估计，3030万人患有糖尿病（9.4%），美国人口），截至2018年。据估计，2011年全世界有3.46亿人患有糖尿病，预计2005年至2030年糖尿病患者人数将翻一番。糖尿病会影响身体产生或使用胰岛素的能力，胰岛素是一种允许身体将葡萄糖（糖）转化为能量的激素[ 1 ]。糖尿病导致人体的问题，如心脏病、中风、低血糖（低血糖），&糖尿病，性方面，& 膀胱问题，糖尿病，口香糖疾病，其他牙科问题，糖尿病神经病变，糖尿病肾病，糖尿病足问题，糖尿病眼病。&&受DME影响的眼睛如图1所示[29]（图片来源：新加坡眼科研究所）。糖尿病黄斑水肿（DME）是最常见的糖尿病眼病，由称为糖尿病视网膜病的糖尿病并发症引起。糖尿病视网膜病变（D.R.）糖尿病性黄斑水肿（diabetic macular edema，DME）是糖尿病相关性视力丧失的最常见原因。但糖尿病，反过来，DME，可以预防，如果它是预测和良好的管理。预防和早期发现对维持视力至关重要。早期的研究表明，良好的血糖水平控制将降低DME的风险和影响但是，在特殊情况下，尽管* 通讯作者：Thuyloi大学计算机科学与工程学院，175 TaySon Str。东达区，越南河内电子邮件地址：raajiimegce@gmail.com（G. Rajesh），raajii. gmail.com（X.M. Raajini），martinsagayam@karunya.edu（K.M. Sagayam），hiendt@tlu.edu.vn（H.Dang）。https://doi.org/10.1016/j.imu.2020.100362接收日期：2019年12月30日;接收日期：2020年5月26日;接受日期：2020年6月2020年6月4日在线提供2352-9148/©2020的自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页：http://www.elsevier.com/locate/imuG. Rajesh等人医学信息学解锁20（2020）1003622Fig. 1. 糖尿病视网膜病变资料来源：新加坡眼科研究所。血糖控制正常的糖尿病患者发生DME，血糖控制不良的糖尿病患者不发生DME。这表明，其他因素，如基因或性状是一个重要的标准发展DME。DME可能是视网膜色素变性的并发症，视网膜色素变性是一种影响周边和侧面视力的遗传性疾病。由于它也是遗传性的，因此可以通过研究一个人的基因型来预测和预防[1，2]。在这几十年的全基因组关联研究（GWAS）中，对DME等复杂疾病的遗传结构研究的需求比以往任何时候都要高。单核苷酸多态性（SNPs）数据量巨大，这给复杂疾病的遗传特征分析带来了挑战。多态性是基因组中的一个区域，在每个生物体中都是不同的。它是一种常见的遗传变异类型，发生在整个基因组中;通常，每个个体每300个碱基就有一个SNP [3]。由于复杂疾病的增加，基因型-表型相互作用的研究具有重要意义。93%的基因含有至少一个SNP。复杂的疾病可以通过观察在患有和没有疾病的人中发现的与许多遗传变化相关的或多或少的SNP变化来识别。这种形式的研究通常被称为全基因组关联研究（GWAS）。识别SNP-SNP与特定疾病的相互作用将使科学家能够检测个体发展疾病的特征以及检测到的疾病如何在他们自己的家庭中运行[26，27]。这些风险SNP可以帮助识别复杂疾病的生物结构，这有助于预防和治疗[3]。大多数SNP对任何生物体的影响都很小。然而，SNPs的功能后果导致mRNA转录物稳定性、氨基酸和转录因子的结合亲和力的变化。群体中的低频遗传变异被称为突变。GWAS已成为研究和分析人类复杂疾病特征的重要手段之一。随着最近基因分型技术的爆炸式发展，SNP数据的数量和质量急剧增加[4]。因此，与复杂疾病相关的SNP-SNP相互作用的鉴定在疾病易感性中起着至关重要的作用[16]。上位性是指一个基因的作用依赖于一个或多个修饰基因的存在[21受糖尿病影响的人患眼部疾病的风险很高。一个原因是糖尿病和其他并发症会对视网膜血管造成损害，这就是糖尿病视网膜病变。黄斑是指称为黄斑的部分，它是眼睛的中心部分，负责锐利的中心视觉。来自液体的组织炎症定义为水肿[28，30，32]。DME起源于受损的血管泄漏液体并导致肿胀，这反过来又模糊了视力。如果视网膜病变减弱，图二. 单核苷酸多态性的结构。视网膜上可能会形成新的不健康的血管，这些血管很容易破裂和出血，导致严重的视力丧失，甚至永久性失明。DME的症状将通过视力模糊、复视、对比度丧失和视力丧失的症状来诊断，这些症状可能表现为漂浮在眼前的小黑点或黑线。1型或2型糖尿病患者患DME的风险更高1.1. 单核苷酸多态性核苷酸被定义为单个DNA链中的差异。例如，在特定的DNA线程中，SNP可以用核苷酸鸟嘌呤（G）取代核苷酸腺嘌呤（A）[13]。SNP被认为是遗传变异的标准度量，在许多复杂的疾病性状中起着至关重要的作用[5]。单核苷酸多态性的结构如图所示。二、文献观察有助于了解上位互作预测在实现高精度方面存在的问题和挑战，这有助于确定研究空白并制定本工作的目标。从各种文献研究中观察到[17，18]，通过检测人的基因型-表型数据中的上位相互作用来控制复杂疾病的严重程度是非常可能的。已经发表了各种文章，通过图像处理、光学相干断层扫描（OCT）成像、上位相互作用分析等不同方法预测DME，并通过检测视网膜中的渗出物进行手动评估[19]。接下来的部分讨论了上位互作预测的相关研究。Sun等人[6]提出了一种利用蚁群优化算法检测上位相互作用的方法。这是一个迭代过程，在视网膜相关黄斑变性数据集中搜索SNP相互作用。他们在蚁群算法中引入了启发式信息，从而提高了检测的准确率。尽管如此，主要的缺点是如果交互是在超过2路交互，他们提出的算法无法检测。它需要多层次的假设检验来检测SNP中多于双向的相互作用。Velez等人[7]分析了基因型和表型模拟数据，以在多因子降维（MDR）技术的帮助下检测SNP之间的相互作用。他们用他们提出的算法优化了数据，并检测了SNP之间的相互作用。他们工作的优点是，所提出的方法将多维基因型-表型数据减少到单一的G. Rajesh等人医学信息学解锁20（2020）1003623ðÞðÞðÞ;图3.第三章。所提出方法的架构图。使用建设性归纳法的维度。尽管如此，他们工作的主要缺点是，如果数据大小增加，准确率会降低[20]。Qi等人[8]提出了一种通过使用称为随机森林的机器学习方法来检测基因型-表型数据中的上位相互作用的方法。使用随机森林算法来检测SNP相互作用的优点在于，森林中的每棵树都是使用来自数据的实例的自举样本来生长的。此外，这种随机森林技术的主要缺点是，这种随机森林方法仅在树不表现出与其他树的相关性时才优于检测。Tomita等人[9]提出了一种检测上位相互作用的方法，以在人工神经网络和ANN的帮助下发现儿童过敏性哮喘，他们引入了参数递减方法。交互检测的评价也由一个实用的组合值决定。在一些先前完成的关于上位性检测的工作已经使用了穷举搜索方法，如多因子近似性降低（MDR）。此外，在一些论文中，生物启发的算法，如蚁群优化（ACO）已被用于检测上位相互作用。然而，在穷举搜索方法中，如果数据量很大，则计算能力太低[9]。在ACO方法中，上位相互作用检测的准确性非常高[10]。然而，这种基于ACO的方法的缺点是交互计数大于2，并且它需要多层假设检验，这更具挑战性[11，12]。2. 方法为了解决现有方法中存在的不足，提出了一种基于统计方法、支持向量机和kNN的高阶上位性检测方法。2.1. 统计方法在统计方法中，检测三向上位性相互作用，其中两个步骤称为搜索和测试。在搜索阶段，对称不确定性（S. U.）计算数据集中的每个SNP。接下来，选择具有高对称不确定性值的3个SNP作为指导，以选择和分离主要与疾病状态相互作用的在测试阶段，为了验证基因型和表型，利用G-检验方法。对于每个SNP-SNP相互作用，借助于G检验计算P值。如果p值为10- 11，则数据中存在双向交互作用，而p值在10- 11和10- 17之间，则为3向交互作用。<疾病的严重程度是如果上位相互作用为3向，则为高。所提出的方法的架构图如图所示。3.第三章。首先，对称不确定性是一种度量数据相关性的统计方法。本文使用该方法来寻找每个SNP与疾病状态数据之间的相关性。对称不确定性表示为，SUXC2IX;DS（ 1）二氢苯并噻吩其中，S： U： X; DS是基因座中每个SNP和疾病状态的对称不确定性。是数据集中每个SNP与疾病状态之间的相互作用增益。H X; DS是多个变量的联合熵。IX;DSHX H Y-HX;Y（2）其中，I（X，DS）是基因座中每个SNP与疾病状态之间的相互作用增益。为了测量SNP基因座（X）和表型（D.S.）相互作用增益已经被使用H（X）和H（Y）是X和Y的熵H（X，Y）是（X，Y）的联合熵G. Rajesh等人医学信息学解锁20（2020）1003624Xð ÞnðÞ¼¼¼100%;100%K--¼¼1/1n我I1I2I3Ei2¼nHX-p x ilog pxi（3）1/1其中，pXi是SNP的第i个基因型的概率。其中SNP和疾病状态的联合熵按下式计算，解决方案，功能，Fzsgn. 中国（11）预测看不见的样本类。该符号由下式给出：fz2f-1;1g（12）H X X XXp xX…log p Xi1Xi 2（四）其中，-和-值分别表示非DME和DME。1;2;：;k-1/1i1;i2;：ikð的情况。*电子邮件算法1. 对于i 1到N做其中，X1;X2;...：Xk是k个SNP变量，其中（xi 1，xi 2，... Xik）特别这些SNP基因座的基因型值，以及p Xi1;Xi 2;每个SNPs一起出现。算法 1.初始化：{Si，DS}{（s1，s2，2.计算每个SNP的SU。对于i 1到N，计算SU {Si，DS}结束第二，交互权重（I.W.）已经检测到两个SNP组合之间的差异，并且其表示为计算训练向量Si端2. 用Si训练SVM。3. 测试SVM并预测输出。2.3. k近邻K-最近邻（kNN）被认为是一种非参数学习算法，因为它不假设任何关于底层数据的信息，并且由于没有训练阶段而成为懒惰算法。对于模型实现，Xi是第i个样本的m维输入向量IWF X YIGX;Y;C（5）HXHY定义为，X1SNP;SNP;SNP;Þ在哪里，I.G.（X：Y，D.S.）是两个SNP组合的信息增益，信息增益是通过知道每个属性的值而获得的信息总量，并且信息增益表示为IGX;Y;DS I ½X;Y�;DS-IX;DS-IY;DS（6）最后，采用G检验方法验证SNP与疾病状态之间的交互作用。G检验是最大似然显著性检验。对于每个SNP-SNP相互作用，在g检验的帮助下计算P值。g检验的公式表示为，G¼2Xlogg�Oi��（7）我其中m是SNP的总数。对应的输出向量Yi是，Yi2 f0;1g;i1;2;其中N是样本的总数。这些数据集被绘制在多维特征空间上，并带有相应的类标签。为了找到未知样本S的类别，使用相对于其他标记样本的曼哈顿距离d来确定k个最近邻，如在等式（15）中那样：d1/4Xjxi-yij（ 15）1/1其中，Oi是观察到的变量计数，Ei是零假设下的预期变量计数。如果p值为10 11，则< 即数据中发生了双向交互作用，p值为10- 17，<这是一种三向互动[10]。2.2. 支持向量机SVM是一种用于分类和回归数据分析的监督机器学习模型。在这个模型中，构造了一个超平面，它将不同的类分开。为了实现用于这种相互作用分析的SVM，对应于SNP值及其标签的训练向量由下式给出，算法1. 设置K 7。2. 对于i 1到N，计算距离d。端3. 排序d并根据第k个最小距离找到最近的邻居4. 找出最近邻的类Y。5. 最近邻的多数类是输出类。上述方法已在MAT-LAB R2018 a中实现，主存储器为8 GB。在Windows 10环境下。Si½ fXi;Yi gN（八）2.4. 数据集描述其中N是样本的总数，Xi和Yi表示第i个样本的SNP值和类别标签算法最小化，1jjwjj2λXi（9）1/1在以下条件下，imG. Rajesh等人医学信息学解锁20（2020）1003625是的。wT Xib1- 2i;2i�0;8i（10）其中b是偏差，w是学习权重向量，λ是误差项，λ是裕度和误差之间的权衡在找到最佳的模拟具有边际效应和交互效应的疾病。充分表征的DME疾病模型用于检测SNP-SNP相互作用目的[2，3]和[4]。糖尿病性黄斑水肿（DME）是黄斑中的流体的获得，黄斑是糖尿病性黄斑水肿的内部部分。人因血管破裂而死亡。DME的发展导致糖尿病视网膜交叉病变[14，24]。SNP数据从openSNP数据库下载，openSNP数据库是来自23andMe和FamilyTreeDNA的公共存储库[31]。原始数据集由包含以变体调用格式（VCF）编码的SNP数据的文本文件组成。该文本文件包括诸如SNP ID，the eye.在视网膜中，它控制着一个人最详细的视觉能力G. Rajesh等人医学信息学解锁20（2020）1003626见图4。样本数据集。图五、 FP SNP组合的模拟数据。染色体数目、位置和基因型。总共145个样品（88个DME病例和57个不受DME影响的对照样品）用44，107个SNP作为训练特征进行处理，总共62个样品（41个DME病例和21个对照）用于测试，如图1B所示。 13岁该数据集包含1000个SNP数据以及2000个对照和2000个病例。数据集中的每一列表示每个SNP中的一个SNP数据，0、1和2都在那里。0表示纯合等位基因，1表示杂合主要等位基因，2表示纯合次要等位基因。纯合等位基因意味着每个生物体都有两个拷贝的同一个基因的等位基因杂合等位基因是指每个生物体的一个基因有两个不同的等位基因。数据集看起来如上所示图四、2.5. FP SNP组合假阳性SNP是下一代基于序列的变异分析中的重要问题，并且如果假阳性SNP大量存在，则可能具有潜在的灾难性[15，25]。这种假阳性SNP显示了几个变量如何参与与G. Rajesh等人医学信息学解锁20（2020）1003627见图6。 FP SNP组合的p值。见图7。模拟数据的功能SNP p值。疾病状态。下图（图5）显示了每1000个SNP中有多少个SNPs导致疾病状态的改变。该结果图显示了所有100个数据集的假阳性SNP值。下图（图5）显示了整个数据集中的假阳性SNP。2.6. FP SNP P值下图显示FP SNP组合的p值。在此与该p值一起，所有使用的100个数据集SNP-SNP组合的相互作用权重显示在图2中。六、2.7. 功能SNP P值一百个数据集作为输入被提供给所提出的架构，最后，该图表示每个数据集的p值。在一些数据集中，p值在10-17和10-11之间。在所得到的图中，清楚地示出了在给定的100个数据集中的一些数据集中发生了3向SNP-SNP相互作用。受影响的数据集列表根据所提出的方法的结果是2，4，6，8，11，16，24，27，29、43、44、46、53、56、66、67、68、73、74、75、80、86、92、94和99。下图显示了在图1所示的SNP数据中SNP-SNP相互作用的效果。7.第一次会议。在数据集编号44和74中，G检验的p值非常低，因此其表示在那些SNP数据中杂质数量高，因此其G. Rajesh等人医学信息学解锁20（2020）1003628¼¼ ¼ ¼¼¼¼见图8。混淆矩阵X值。见图9。将该方法与现有方法进行了召回率和精度比较。使人将来易患糖尿病视网膜病变。所有其他受影响的数据集都显示了该疾病在一个人的基因型-表型数据中的边际效应。根据这个结果，很明显，这个人处于DME疾病模型的边缘效应中。3. 结果见图10。与现有方法的精度和F1得分的比较.见图11。所提出的方法与机器学习方法的精确度和召回率比较。3.2. 精度在统计分析中，精密度是真阳性数量与检出阳性数量的比值[1]。它也被称为阳性预测值（PPV）。在统计分类问题中，混淆矩阵X是一个特定的表格布局，允许可视化的性能，精密TP公司简介（十七）方法或任何方法。它也被称为误差矩阵X。与TP99，F.P.35，田纳西州499，465和F.N.1，利用每次连续迭代计算混淆矩阵X表，并且检测结果的混淆矩阵X值的结果在图8中示出。其中TN，FP，F.N.，而T.P.代表真阴性、假阳性、假阴性和真阳性。所提出的方法的性能的分析是做一些措施的帮助下：召回率，精度，准确率和F1得分。3.1. 召回在统计分析中，召回率是真阳性数量与阳性数量的比率。在这种情况下，召回也被称为真阳性率或灵敏度，与现有的上位性相互作用检测方法相比，该方法的查全率和查准率。该方法的查全率为99，查准率为73.880，可见真阳性数与实际阳性数的比例很高，真阳性数与检测阳性数的比例几乎超过70%。因此，所提出的方法优于现有的方法，如图所示。 9和图十一岁3.3. 精度准确度是对结果的总体估计，它反映了结果的正确性。下面的公式可以计算精度，召回TP（16）TP准确度TP3.4.F1评分（十八）在统计分析中，F1分数（也称为F分数或F度量）是一个G. Rajesh等人医学信息学解锁20（2020）1003629¼¼见图12。将该方法与机器学习方法的精度和F1图十三. 数据集详细信息。测试准确性的度量f1分数可以表示为，图14. ROC曲线和AUC比较。分别AUC- ROC曲线是预测模型的性能指标. AUC表示模型识别不同类别的能力，而ROC是概率曲线。ROC曲线是真阳性率与假阳性率的从图14，很明显，所提出的方法达到了0.98的最高AUC，而SVM和kNN分别为0.86和0.78。SVM模型比kNN更有效地预测DME易感性，这意味着SVM能够检测复杂的DME易感性。F2模式在的 SNP 数据集。然而，在这方面，的统计方法输出-1分，19岁以下儿童（19）召回精度þ在预测DME中执行了所有机器学习模型。采用交叉验证方法对模型进行了验证分析。该方法的准确性和F1得分相比，与其他现有的方法检测上位相互作用。该方法的准确率为99.99%，F1得分为84.615%，与现有方法相比，检测结果具有较高的正确性和准确性，如图所示。 10和图 12个。4. 讨论上位相互作用的检测有助于检测糖尿病视网膜病变。统计方法应用于DME数据集预测高阶上位相互作用。两对该方法的查全率和查准率的测试结果表明，该方法的真阳性数与实际阳性数的比值较高，真阳性数与检测阳性数的比值也较大。目前的研究表明，统计检测是一种有效的方法来发现的相互作用。F1评分与现有方法的对比研究也证明了预测的正确性和较高的精度。这些发现支持了糖尿病视网膜病变可以通过上位相互作用检测的假设。使用机器学习模型的最重要步骤是识别模型参数，以获得最大的模型性能。在kNN的情况下，k的值起着非常重要的作用。假设k的值为1，3，5，7，9，11，13，15，发现k的最佳值为7。在SVM的情况下，λ的假设值为1、10、100，ε分别为0.002，0.1，0.001，0.0001。在测试了对于整个数据集，在kNN的情况下选择k的最佳值为7，而在SVM的情况下选择λ 100和ε在整个数据集上实现了kNN和SVM机器学习模型，其准确率分别为61.7%和62.17%曼斯他们是评价使用留一交叉验证（LOOCV）方法，其中在剩余样本上训练模型5. 结论和今后的工作该方法能够以较小的计算复杂度检测高阶上位相互作用。随着上位性相互作用的检测，糖尿病黄斑水肿（DME）也被检测到。嵌套上位相互作用也可以检测与所提出的方法的帮助下。相互作用的基因座对疾病的真阳性状态有重要贡献。然而，所提出的方法检测高阶上位相互作用。尽管如此，仍需要关注致病性多位点SNP相互作用与严格疾病状态的组合。尽管如此，现在还没有合适的方法来检测几种疾病模型与多位点SNP相互作用的上位性，因为相当数量的计算复杂性。因此，利用超级计算技术和云计算方法检测多位点的高阶上位性必须更加集中。竞合利益作者声明无利益冲突附录A. 补充数据本文的补充数据可在 https ： //doi 网站上找到。org/10.1016/j.imu.2020.100362。G. Rajesh等人医学信息学解锁20（2020）10036210引用[1] 王X，埃尔斯顿RC，朱X. 互动的意义70 .第70章我的世界[2] Cordell HJ.检测人类疾病背后的基因-基因相互作用。NatRev Genet 2009;10：392-404.[3] 亨特DJ。人类疾病中的基因-环境相互作用。Nat Rev Genet 2005;6：287-98.[4] 韦尼克湾单核苷酸多态性（SNP）分析的算法易处理性及相关问题。汉堡，德国：外交出版社;2014年。[5] 艾米丽·马修病例对照全基因组关联研究中基因-基因相互作用统计方法的调查。J Soc Fr Stat 2018;159（1）。[6] 孙毅，王翔，尚军，刘建新，郑春华，雷翔。在蚁群算法中引入启发式信息进行上位性识别。IEEE ACM Trans Comput Biol Bioinf 2018.https://doi.org/10.1109/tcbb.2018.2879673.[7] Velez DR，et al. A balanced accuracy function for epistasis modeling inimbalanceddatasets using multifactor dimensionality reduction.《遗传流行病学》2007年第31期：306[8] 齐耀生物信息学的随机森林。In：Ensemble Machine Learning. Berlin，Germany：Springer.[9] 李文，等.儿童过敏性哮喘易感基因单核苷酸多态性的人工神经网络筛选及预测模型的构建.中国医学科学院学报，2001，13（1）：119 - 119. BMC生物信息2004;5.[10] 景PJ，沈HB. MACOED：一种用于全基因组关联研究中SNP上位性检测的多目标蚁群优化算法。出版社：O X Ford University Press 版权所有Bioinformatics2015;31（5）：634-41.[11] 刘勇，高春，张智，陆勇，陈生，梁明，等。基于物理量的蚁群系统求解NP难问题。IEEE/ACM Trans Comput Biol Biofinform2017;14（1）：108-20.https://doi.org/10.1109/TCBB.2015.2462349网站。[12] TuoJ，Zhang X，Yuan Y，Zhang，Liu Z，Fhsa-Sed.基于和声搜索算法的全基因组关联研究的双位点模型检测 PloS One 2016年3月 25日;11（3）：e0150669。[13] Manolio TA，Bailey-Wilson JE，Collins FS.基因、环境和前瞻性队列研究的价值。 Nat Rev Genet 2006;7：812-20.[14] Uppu Suneetha，Krishna Aneesh，Gopalan Raj P.在高维基因组数据中检测SNP相互作用的方法综述。 IEEE/ACM Transactions onComputational Biology andBioinformatics. 卷15; 2018年3月/4月p. 二、[15] 马赫湾遗传性缺失的案例 Nature 2008;456：18-21.[16] Thomas D.基因-环境关联研究：新兴方法。 NatRev Genet 2010;11：259-72.[17] Ahmad S，Varga TV，Franks PW.肥胖的基因-环境相互作用：证据的状态。2013;75：106-15.[18] 遗传家庭参考国家医学图书馆在线。https://ghr.nlm.nih.gov网站。[19] GriffithOL，，et al. Anno O Reg. 一个开放获取的社区驱动资源，用于监管注释。核酸研究2008;36：D107-13。[20] [10] Tuo S，ZhangJ，Yuan X，Zhang Y，Liu Z.Fhsa-SED：使用和声搜索算法进行全基因组关联研究的双位点模型检测。PloS One2016;11（3）：e0150669.[21] 凯雷姆BS.囊性纤维化基因的鉴定：遗传分析。Trends Genet1989;5.[22] 帕久科夫湖在遗传密码线之间：理解疾病和复杂表型的遗传相互作用。Cambridge，MA，USA：AcademicPress; 2013.[23] Huang T，Hu FB.基因-环境相互作用与肥胖：最近的发展和未来的方向。BMCMed. Genomics. IEEE/ACM trans.生物信息学2015年;vol. 8.第八条。卷号152，三月/四月2018.[24] Wei WH，Hemani G，Haley CS.检测人类复杂性状中的上位性。NatRev Genet2014;15：722-33.[25] [1]张杰，张军，袁晓，何志，刘毅，刘忠.小生境和声搜索算法用于检测复杂疾病相关的高阶SNP组合。Sci Rep 2017;7：11529.[26] 张勇，刘建生。病例对照研究中上位相互作用的贝叶斯推断。 NatGenet2007;39：1167[27] 姜瑞，唐伟，吴晓，傅伟。病例对照研究中上位性相互作用检测的随机森林方法。 BMC Bioinf 2009;10：1-12.[28] Genentech：糖尿病性黄斑水肿[Internet]。Gene.com，https://www.gene.com/patients/disease-education/diabetic-macular-edema; 2020 [2020年3月29日引用]。可从：。[29] 糖尿病视网膜病变。眼科疾病专家顶级眼科医生纽约市[互联网]。Manhattan EyeDoctors Best Rated Specialists in NYC，https://www.eyedoctorophthalmologistnyc.com/treatment/diabetic-retinopathy-eye-disease/; 2020 [引用于2020年3月29日]。&可从：。[30] 单核苷酸多态性（SNPs）在糖尿病性黄斑水肿患者和非糖尿病性黄斑水肿患者中的评价ClinicalTrials.gov [Internet]. ClinicalTrials. gov，https://clinicaltrials.gov/ct2/show/NCT01168258; 2020年[2020年4月3日引用]。可从：。[31] OpenSNP [Internet]. Opensnp.org.https://opensnp.org; 2020 [引用日期：2020年4月3日]。可从以下网址获得：[32] https://www.gene.com/patients/disease-education/diabetic-macular-edema网站。

下载后可阅读完整内容，剩余1页未读，立即下载