没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁25(2021)100646基于最小误差校正的模糊c-均值聚类单倍型重构方法Mohammad Hossein Olyaeea,Alireza Khanteymoorib,*,Ebrahim Fazli ca工程学院,计算机工程系,Gonabad大学,Gonabad,伊朗b伊朗赞赞大学计算机工程系c伊朗赞詹伊斯兰阿扎德大学赞詹分校计算机系A R T I C L EI N FO保留字:生物信息单个体单倍型模糊c均值聚类最小误差校正A B S T R A C T研究人类基因进化已经引起了相当大的关注。单倍型测定提供了关于人类遗传学的关键信息,并有助于理解性状和疾病之间可能的因果关系。通常,单倍型重建的实验方法在时间和资源方面是过高的。最先进的高通量测序使得能够利用计算方法来完成这项任务。然而,当前的测序算法一旦其输入片段的错误率增加就遭受截断准确性。在本文中,我们提出了FCMHap,一个有效的和准确的方法,它包括两个步骤。在第一步中,它构造了一个加权模糊冲突图的基础上获得的相似性的输入片段,并划分在两个集群中的输入片段的划分图在迭代的方式。由于输入片段由噪声和间隙组成,在下一步中,它采用聚类中心,利用模糊c-均值(FCM)算法。所提出的方法已在几个真实的数据集进行了评估,并与一组选定的当前方法进行了比较。评估结果证实,这种方法可以是这些方法的伴奏。1. 介绍人类基因组计划的努力表明,人类99%以上的DNA序列是相同的[1]。 因此,基因组差异是造成我们表型差异的原因,因此可以在广泛的应用中考虑,例如医学,药物设计,疾病诊断和研究人口历史[2,3]。单核苷酸多态性(SNP)是DNA序列上具有常见变异的位点[4]。参与SNP的核苷酸称为等位基因。单倍型是位于特定染色体中的SNP数目的集合。最近的工作支持这种观点,即单倍型比单个SNP具有更有价值的信息[5]。在二倍体生物体中,例如人类,基因组被组织成成对的染色体,其中一对染色体中的一个元件遗传自父亲,另一个元件遗传自母亲,分别称为父系和母系。因此,从每个拷贝,可以获得一个单倍型序列[6,7]。单倍型的实验测定需要过多的时间和成本。这鼓励使用计算方法来完成这项任务。已经设计了多种方法来解决单体型重建问题。其中主要有:单体型推断[8本文的方法是基于单倍型组装。在他们的开创性工作[21]中,Lancia和同事提出了单体型组装问题。它基于这样的假设,即存在属于一对染色体的一些短SNP片段。他们的模型将这些片段分成两个簇,这样每个单倍型都可以重建。一般来说,由于与这些片段和缺口以及二倍体生物体相关的错误,这个问题是具有挑战性的。发现和纠正一个片段的错误已经解决了几个作品。最小片段去除(MFR)、最小SNP去除(MSR)、最长单体型重建(LHR)和最小错误校正(MEC)[21]是它们的四个主要代表。虽然MEC提出了最复杂的方法相比,它的同行,它已经收到了很大一部分的关注,因此已被用于许多相关的工作。这表明MEC问题是NP难的[22]。已经提出了许多方法来解决SIH问题的MEC模型的基础上,它可以分为精确,元启发式和概率方法。* 通讯作者。电子邮件地址:mh. gmail.com(M.H. Olyaee),khanteymoori@gmail.com(A. Khanteymoori),efazli@znu.ac.ir(E.Fazli)。https://doi.org/10.1016/j.imu.2021.100646接收日期:2021年3月22日;接收日期:2021年6月18日;接受日期:2021年2021年6月22日在线提供2352-9148/©2021的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuM.H. Olyaee等人医学信息学解锁25(2021)1006462×图1.一、 SNP片段的示例。(a)具有原始测量的SNP矩阵。(b)其元素已被转换为0/1的SNP矩阵E-x- act方法试图准确地解决问题并最佳地重建单倍型。MLF [23]和2d [24]是基于MEC模型的两个示例。前者使用每个SNP位点的置信度得分。他们研究的主要缺点是,对于真实数据集,置信度得分的信息不可用。后者的主要贡献是利用两个距离度量聚类输入片段。DGS [25]使用输入片段的子矩阵。它从包含最小间隙的片段开始以初始化单倍型,并通过以迭代方式选择片段来完成单倍型。应该注意的是,选择片段的顺序可能对重建的单倍型具有不利影响。Fast [26]根据间隙开始的位置对输入片段进行排序,并将其分配给聚类。这种方法是针对无间隙片段提出的,不适用于有间隙的片段。然而,这些方法必须对输入片段施加一些约束[18,24,27,28]。由于MEC问题是NP难的,因此已应用GA和PSO等元启发式算法来解决它。在这种情况下,目标函数已基于MEC模型设计,并且该方法试图迭代地增强它[6,15,29这些方法的一个主要缺点是它们在评估目标函数时的高时间复杂度。输入数据的差距和错误促使一些研究人员提出概率模型来解决这个问题。例如,HASH[19]及其改进的CUT [20]是这类方法中的两种主要方法。作为主要贡献,CUT方法表示MEC优化作为一个最大割问题。然而,由于它是一种基于遗传算法的方法,并且从随机的单倍型集合开始,因此它容易陷入局部最优。SHR [33]是一种基于随机化的方法,它迭代地随机选择输入片段,并通过利用汉明距离将它们分配到最接近的集合。SPH[34]是一种基于统计学的方法,其利用SNP之间的统计学差异作为主要贡献,并将其用于具有低覆盖率的高噪声片段。FastHap方法的设计目标是提高准确性和时间复杂度。在其第一步中,它测量的每对片段的相异性由一个新的距离度量;接下来,加权图是建立在所获得的措施的基础上,然后,创建的图被用来划分的片段一个接一个;最终,开发的初始分区,以提高整体MEC。虽然它具有较低的时间复杂度,实验结果表明其出色的性能。然而,该方法的效率在寻址输入时降低具有高错误率的片段。模糊c均值(FCM)聚类是一种无监督技术,已广泛应用于各种领域,如地质学、医学成像、目标识别和图像分割[35这种方法相对于称为硬c-均值(或k-均值)的非模糊聚类的主要优点是每个样本可以根据其隶属度的度量属于多个聚类。这种能力在处理噪声数据方面更有前途,并降低了其对现有噪声的敏感性[41]。单个体单倍型(SIH)重构问题是生物信息学中一个活跃的研究领域,它可以建模为聚类问题。目前大多数方法都是根据输入片段的距离对它们进行聚类。然而,输入片段的误差和间隙使得距离计算不可靠。因此,应用FCM使我们能够减少输入数据中的间隙和噪声在FCM的基础上,提出了一种新的单倍型重组方法,构造方法每个输入片段的隶属度可以更准确地解释它们的属性。所提出的方法包括两个步骤。首先,[42]中建议的距离度量用于构建模糊冲突图。然后,基于它们的相似性将输入片段划分为两个在接下来的步骤中,所获得的单倍型是由模糊c-均值(FCM)聚类方法作为初步的中心,它是试图提高以前的划分的准确性。通过对实际数据的实验结果表明,该方法总能找到较好的解。此外,与几种方法的结果比较表明,我们的方法在大多数情况下达到了最佳的精度。本文的其余部分组织如下:在第2节中,SIH问题的正式定义和初步的定义和符号。在第三部分中,讨论了数据表示,并描述了所提出的方法。在第4节中,将该方法与其他流行的方法进行了比较。我们的结论在最后一节得出2. 问题公式化输入数据是一组对齐的片段,它们被表示为m n矩阵X,其中m和n分别是片段的数量和长度。图1(a)展示了具有原始度量的输入片段的示例。在这个矩阵中,每个条目可以是四个图二、 输入片段已被划分为两组的基础上,他们的相似性和h1和h2分别从每个组重建。M.H. Olyaee等人医学信息学解锁25(2021)1006463̂̂̂()2N图三. (a)距离矩阵X,(b)对应于SIX个输入片段的模糊冲突图,以及(c)应用所提出的方法的结果。核苷酸类型,即其中rij=D(hi,<$hj)=∑nd(hi k,hj k)和. d(x,y)={0,如果x=y(间隙)用“-”表示。缺失信息是指在测序过程中无法以足够的置信度确定其测量值的SNP。由于每个SNP有两个可能的等位基因,每个SNP的等位基因可以用“0”和“1”表示。为此,少校k=13. 材料和方法1、否则等位基因(频率较高的等位基因)用“0”表示因此,原始矩阵X被转换为二进制(图1)。 1(b))。原始单倍型是一对长度为n的二进制字符串H(h1,h2)。SIH重构的目的是将SNP矩阵按行分为两部分,利用这两部分重构相应的单倍型。如果片段是无错误的(图1),那么它们可以被聚类成两组,使得每个聚类中的所有片段都是兼容的(图2)。然而,在错误的存在下,有一些片段与两个聚类有冲突。在这种情况下,我们应该重建单倍型的方式,使目标函数最小化。在这项研究中,我们定义了这个函数的基础上,最小错误校正(MEC)[21,43]。设Hh1,h2为一对重构的单倍型。该算法的准确性通过重建率(RR)[6]来衡量,其定义为:为了提出一种适合于生物系统的分析方法,如最近的出版物[14,39-下面,我们将逐一介绍如何处理这些步骤。3.1. 材料Geraci该数据集由来自具有北欧和西欧血统的犹他州居民(CEU),尼日利亚伊巴丹的约鲁巴人(YR),日本东京的日本人(JPT)和中国RR(h,rh)=1-min{r11+r22,r12+r21}(一个)(六氯苯)。它已被一些研究人员广泛使用[14,15,17,44有三个与数据集相关的参数:单倍型长度、错误率和覆盖率,分别用l、e、c表示。每个参数都有几个不同的值,l={100,350,700 },e={100,350,700}。图四、所提出的方法的算法。M.H. Olyaee等人医学信息学解锁25(2021)100646表44̂∑̂=6̂()2()下一页长度为100的100个样本的平均重建率。在每一行中,绿色到红色表示从底部到顶部的结果。{0.0,0.1,0.2,0.3},c{3,5,8,10}。错误率是指不精确读取例如,当e等于0.1时,这意味着10%的可用数据是噪声。此外,覆盖率参数是指在数据集生成期间对于这些参数的每个组合,有100个实例。3.2. 数据公式化根据上一节,假设输入SNP片段是一个称为SNP矩阵的m×n矩阵。每两个片段X=(x1,x2,nD(X,Y)=d(xi,yi)(2)i=1至少已经被fi或fj覆盖了。因此,归一化距离等于4。5= 0。75.接下来,如图3(b)所示,构造相应的模糊冲突图。最后,所获得的距离被用来对所有片段进行二分区。如果输入片段是无噪声的,则它们可以容易地分成两组,其中每组由完全兼容的片段组成。然而,在噪声存在的情况下,它已被证明,确定最佳聚类是一个NP难问题。在这种情况下,模糊冲突图的属性可以帮助以适当的方式执行该任务。应当注意,该聚类是基于片段之间的不相似性来完成的。为了这个目的,如图4中的算法的细节所描述的,其权重 等于或小于pivot(0.5)的值被忽略。之后,选择具有最大权重的边,并且将它们的对应片段(即,fi和fk)分别分配给聚类C1和C2。很明显根据它们的距离,它们不可能位于同一簇中布吕德X y如果x=y,=闪烁y1 0(三)接下来,在每次迭代中,将两个与(,)=1如果x,y和x,100美元。5其他∈{,}选择簇并将其分配给相反的簇。将重复 直到 所有 的 片段 是 划分 之间 集群。值得注意的是,Eq。(3)是一种汉明距离,在Ref中使用[42 ]第42段。当x或y等于gap时,关于它们相似性的信息。在这种情况下,dx,y被设置为0.5。当量(2),产生所有输入片段之间的距离。然后构造一个完全模糊冲突图,它有m个顶点,顶点数等于片段数,每条边表示两个对应片段之间的距离。在模糊冲突图中,每两个其对应的片段至少在一个位置上不匹配的节点彼此连接。此外,每个边的权重准确地描述了片段对之间的不相似性的量。例如,图3(a)中所示的矩阵表示图1的所有六个片段之间的归一化距离以及它们对应的模糊冲突图。3.3. 该方法从图中可以看出。 4、该方法分为两个阶段,即早期聚类和模糊c均值聚类。最初,根据等式(1)计算所有片段之间的(二)、例如,考虑片段f1={- -1- - 001}和f5={--1 - -001}。最后,获得聚类的中心作为初始单倍型为为此目的,每一立场的衡量标准都是通过多数表决确定的。该阶段在多项式时间内终止。设n为图的片段数,则所构造的图的边数等于n(n-1)。删除权值小于pivot的边在O(n2)内完成。寻找边缘最大权值的算法可以在O(n2)内完成。说明3.3和时间复杂度为O(n)而且,将片段分配到簇需要O(1)。因为在最坏的情况下,循环重复n2次,所以这个阶段的时间复杂度是O n4。在第二阶段,通过模糊c-均值算法将获得的聚类(获得的单体型)的中心用作初始中心。第一步提高了FCM的收敛速度,减少了迭代次数。FCM算法根据模糊聚类规则将片段分配到每个聚类中,会员资格设uij2×n∈ [0, 1]是第j个片段对i∈ {1, 2}的第i个簇的隶属度,矩阵XU=[uij]2×n包含第i个簇的所有元素.所有碎片的碎片。以这种方式,每个片段可以通过不同的隶属度属于两个聚类中的任何一个。该算法是一种迭代优化,其最小化定义为以下的成本函数:{1-01--10}图中 1(a). 有六个位置,由f1或f5覆盖。根据等式(3)所有的dif的总和J=∑ ∑um d2(四)结果与4.5相同注意,对于每两个片段fi和fj,通过SNP位点的数量将获得的测量归一化,伊季j = 1i=1M.H. Olyaee等人医学信息学解锁25(2021)1006465()下一页∑表2100例长度为350的样本的平均重建率在每一行中,绿色到红色表示从底部到顶部的结果。表3100例长度为700的样本的平均重建率在每一行中,绿色到红色表示从底部到顶部的结果。其中,dij是每个聚类中心与输入片段之间的距离,其基于等式(1)计算。2,C是与2相等的簇的数目,n是片段的数目,并且m是控制所得分区的分数的常数。这个度量可以设置在1到无穷大之间,并且没有任何理论方法来确定它。在这项研究中,基于过去的几项研究,m等于2[36,40,隶属度值,并且低隶属度值被分配给远离质心的片段。图3(c)展示了将所提出的方法应用于输入片段的结果。这个阶段的时间复杂度是Ont,其中n是片段的数量,t是迭代的数量。4. 实验结果47更新后的成员资格计算自d-2/(m-1)u(t+1)=ij矩阵X和 集群 中心是(五)为了评估我们的方法的性能,如前所述,我们使用了Geraci研究中的数据集为了评估所提出的算法的性能,它与ijc-2/(m-1)∑k=1dkjGeraci研究中研究的算法所提出的方法称为FCMHap的结果以及其他的结果ni=∑numfjum(六)算法可以如下所示。应当注意,表1hj=1ijj=1ij重复最后两个步骤,直到比预处理更好分别是350和700。这些表中的前两列分别表示错误率和覆盖率。为了评估性能先前的迭代低于阈值ε。成本函数最小化当靠近其簇的质心的片段被分配为高时在第1阶段中,这一部分获得的结果单独列在名为FCG的列中。我们的方法的结果可以在M.H. Olyaee等人医学信息学解锁25(2021)1006466表4长度为100的示例的平均运行时间(秒)。在每一行中,绿色到红色代表最慢到最快的方法。表5长度为350的示例的平均运行时间(秒)。在每一行中,绿色到红色代表最慢到最快的方法。最后一列。在每一行中,根据RR值从底部(绿色)到顶部(红色)对结果进行排名。有趣的是,所有的compering方法在无错误的情况下都有很好的性能。然而,通过增加噪声和间隙的量,它们的性能急剧下降。在FCG专栏中列出的第一阶段的有希望的结果表明,模糊冲突图可以有效地描述输入片段之间的相似度。通过使用FCM,每个片段可以属于两个聚类。他们的归属已被确定根据其成员的程度措施。隶属度能够更准确地描述每个片段的归属,特别是对于含有大量噪声的输入片段。因此,从上一列可以看出,在所有情况下,应用FCM都有趣地改进了前一步的结果。实验结果表明,FCMHap算法在大多数情况下都优于其他算法.在本研究中,我们的重点是提高重建率。然而,为了提供一个全面的评估所提出的方法,其运行时间进行了比较,对其他方法。为此,对于每个组合,参数,该方法已运行在一个普通的台式PC机超过10个样品,已被随机选择。已收集每组参数的平均运行时间,见表4实验结果表明,该方法的运行时间比其他方法都要长。但它的运行时间是多项式的,在最坏的情况下,它可以在不到3分钟的时间内重建单倍型5. 结论提供大量的基因组序列增加了单个个体单倍型问题的重要性。单倍型的确定在几个领域都很有用,例如了解遗传变异和复杂疾病之间的关系。由于基于实验室的方法耗时且昂贵,因此已经提出了几种基于计算的方法,其直接从读数重建单体型。然而,在处理噪声输入数据时,它们的性能会显著降低。我们有M.H. Olyaee等人医学信息学解锁25(2021)1006467表6长度为700的示例的平均运行时间(秒)。在每一行中,绿色到红色代表最慢到最快的方法。提出了一种基于层次的方法FCMHap。首先,利用模糊冲突图有效地描述了输入片段之间的相似性。此外,在下一步中,它利用FCM算法,考虑每个输入片段的模糊隶属度,使FCMHap能够有效地聚类噪声数据。实验结果表明,使用FCM算法可以提高重建率,特别是对于高错误率的数 据 。 在 未 来 的 工 作 中 , 我 们 将 集 中 精 力 应 用 FCM 的 扩 展 , 如Pythagorean Fuzzy c-means(PFCM)算法提高了单倍型重建的精度。应 该 注 意 的 是 , 用 于 编 写 本 文 的 代 码 可 在https://github.com/mholyaee/FCMhap上找到。利益冲突手 稿 “Afuzzyc-meansclusteringapproachforhaplotypereconstruction based on minimum error correction“的作者,其姓名列于下面,证明他们与任何组织或实体没有任何联系或参与任何经济利益(如酬金;教育补助金;参加演讲局;会员资格、就业、咨询、股票所有权或其他股权);和专家证词或专利许可安排),或非经济利益(如个人或职业关系、从属关系、知识或信仰)。竞合利益作者声明,他们没有已知的可能影响本文所报告工作确认我们要感谢我们在伊朗Zanjan的Zanjan大学机器学习和生物信息学实验室(MLBL)的同事们的帮助。作者也要感谢博士。F. Geraci提供了他的基准数据集。引用[1] Venter JC等人,《人类基因组序列》。Science 2001;291(5507):1304-51.[2] 复杂疾病中的序列变异性和候选基因分析:μ阿片受体基因变异与物质依赖的关联。分子遗传学2000;9(19):2895-908.[3] Bafna V,et al. Polynomial and APX-hard cases of the individualhaplotypingproblem. Theor Comput Sci2005;335(1):109-25.[4] 作者:WangZ,Moult J. SNPs、蛋白质结构和疾病 Mutat 2001;17(4):263-70.[5] Stephens JC,et al. Haplotype Variation and Linkage Disequilibrium in 313HumanGenes. Science2001;293(5529):489-93.[6] Wang R-S,et al.,Haplotype reconstruction from SNP fragments by minimumerrorcorrection.生物信息学2005;21(10):2456-62.[7] Zhao Y,et al. An overview of the haplotype problems and algorithms.前沿计算科学2007;1(3):272-82.[8] Wei B,ZhaoJ. Haplotype inference using a novel binary particleswarmoptimization algorithm. Appl Soft Comput 2014;21:415-22.[9] [104] Han B,Eskin E. Hap-seq:一种利用测序数据进行单倍型定相和插补的优化算法。J Comput Biol 2013;20(2):80-92.[10] Graça A,et al. Efficient and accurate haplotype inference by combiningparsimonyand pedigree information. Springer;2012.[11] StephensM,Scheet P. 单体型推断和缺失数据填补中连锁不平衡衰减的解释。美国遗传学杂志2005;76(3):449-62。[12] 格斯菲尔德湾纯简约法单体型推断。在:组合模式匹配。Springer;2003.[13] LinS,et al. 随机群体样本中的单倍型推断 美国遗传学杂志2002;71(5):1129-37。[14] ChenX,et al. 基于超图划分的单倍型组装算法。J Theor Biol 2014;358:85-92.[15] Wang T-C,TaheriJ,Zomaya AY. 遗传算法在单倍型重建中的应用。J BiomedInf 2012;45(5):922-30。[16] AguiarD,Istrail S. HapCompass:一个快速循环基础算法,用于序列数据的精确单体型组装。J Comput Biol 2012;19(6):577-90.[17] Mousavi SR,et al. Effective haplotype assembly via maximumBooleansatisfiability. Biochem Biophys Res Commun 2011;404(2):593-8.[18] He D,et al. Optimal algorithms for haplotype assembly from whole-genomesequence data. Bioinformatics2010;26(12):i183-90.[19] Bansal V,et al. An MCMC algorithm for haplotype assembly from whole-genomesequence data. Genome Res2008;18(8):1336-46.[20] Bansal V,Bafna V. HapCUT:一种高效准确的单体型组装算法。生物信息学2008;24(16):i153-9.[21] Lippert R,et al.单核苷酸多态性单体型组装问题的遗传策略。 Bioinf 2002;3(1):23-31.[22] Cilibrasi R,et al. On the Complexity of Several Haplotyping Problems.在:生物信息学中的算法。Springer; 2005.p. 128比39[23] Zhao Y-Y,et al. Haplotype assembly from aligned weighted SNP fragments.计算机生物化学2005;29(4):281[24] 王毅,冯鄂,王荣. MEC模型中基于双距离函数的聚类算法。 计算机生物化学2007;31(2):148-50.[25] Levy S等人,《人类个体的二倍体基因组序列》。PLoS Biol2007;5(10):e254.[26] Panconesi A,Sozio M. Fast Hare:一种用于单个SNP单倍型重建的快速启发式算法。在:生物信息学算法国际研讨会。Springer; 2004.[27] ChenZ-Z,et al. 更好的基于ILP的单体型组装方法J Comput Biol2016;23(7):537-52.[28] 陈志志,邓芳,王玲.从全基因组序列数据进行单体型组装的ex act算法。生物信M.H. Olyaee等人医学信息学解锁25(2021)1006468息学2013:btt349。M.H. Olyaee等人医学信息学解锁25(2021)1006469[29] Ting C-K,et al. A genetic algorithm for diploid genome reconstructionusingpaired-end sequencing. PloS One2016;11(11):e0166721.[30] 作者:WuJ,Wang J. 一种基于粒子群优化的单倍型重构实用算法。应用数学计算2009;208(2):363-72.[31] 作者:WuJ,Wang J. 单个体SNP单体型分型的孤雌遗传算法。Eng Appl ArtifIntell2009;22(3):401[32] Qian W,et al.,Particle swarm optimization for SNP haplotypereconstructionproblem.应用数学计算2008;196(1):266-72.[33] Chen Z等. Linear time probabilistic algorithms for the singularhaplotypereconstruction problem from SNP fragments. J Comput Biol 2008;15(5):535-46.[34] 张文龙,王晓梅,王晓梅. SpeedHap:一个精确的启发式算法,用于解决单个体SNP单体型分型问题,该问题具有许多缺口,高读取错误率和低覆盖率。IEEEACM Trans Comput Biol Bioinf2008;5(4):492-502。[35] Gong M,et al.基于局部信息和核度量的模糊c均值聚类图像分割。IEEE TransImage Process2013;22(2):573-84.[36] Chuang K-S,et al.基于空间信息的模糊c均值聚类图像分割。计算机医学影像图2006;30(1):9-15.[37] 蔡伟,陈松,张丹.结合局部信息的快速鲁棒模糊c均值聚类图像分割算法。Pattern Republican 2007;40(3):825-38.[38] 张松,王荣生,张晓生.基于模糊c均值聚类的复杂网络重叠社团结构识别。物理统计机械应用2007;374(1):483-90。[39] 杨伟,王伟,王伟. 基于生物先验知识的模糊c均值聚类 JBiomed Inf 2009;42(1):74-81.[40] Chaira T.一种新的直觉模糊C均值聚类算法及其在医学图像中的应用。Appl Soft Comput 2011;11(2):1711-7.[41] 苏甘亚河模糊c均值算法综述。国际科学杂志Res. Publ. 2012;2(11):1.[42] 作者:Wang W. FastHap:使用模糊冲突图快速准确地重建单个个体单体型。Bioinformatics2014;30(17):i371-8.[43] Lancia G等,SNPs问题,复杂性和算法。见:2001年欧洲统计局。Springer;2001. p. 182比93[44] 杰拉西湾单个体SNP单体型重建问题的几种算法比较。Bioinformatics2010;26(18):2217-25.[45] 陈志志,邓芳,王玲.从全基因组序列数据进行单体型组装的ex act算法。Bioinformatics2013;29(16):1938-45.[46] 邓芳,崔伟,王磊.单倍型组装问题的一个高精度启发式算法。BMCGenom2013;14(2):1.[47] 范军,韩明,王军。单点迭代加权模糊C均值聚类算法在遥感图像分割中的应用。Pattern Geneva 2009;42(11):2527-40.[48] Maraziotis IA.基因表达数据的半监督模糊聚类算法。PatternGeneva2012;45(1):637-48.[49] Pedrycz W,Rai P.使用模糊C均值及其量化的协作聚类。模糊集系统2008;159(18):2399-427.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功