没有合适的资源?快使用搜索试试~ 我知道了~
乳腺癌微阵列图像的基因表达信息分析和诊断研究-电气系统与信息技术学报2016-8月11日在线发表
可在www.sciencedirect.com上在线ScienceDirect电气系统与信息技术学报3(2016)348乳腺癌微阵列图像Nastaran Dehghan Khalilabada, Hamid Hassanpoura, Mohammed RezaAbbaszadeganbaShahrood University of Technology,Shahrood,伊朗bMashhad University of Medical Sciences,伊朗接收日期:2015年10月22日;接收日期:2016年6月12日;接受日期:2016年6月17日2016年8月11日在线发布摘要微阵列图像被用作诊断癌性疾病的准确方法本研究的目的是提供一种检测乳腺癌类型的首先,从微阵列图像中提取原始数据使用图像处理技术来确定每个基因的确切位置然后,通过与每个基因相关联的像素的总和,提取“基因表达”的量为了识别更多的有效基因,使用了原始数据集上的信息增益方法最后,可以通过使用决策树分析所获得的数据来识别癌症的类型。该方法在诊断乳腺癌类型方面的准确率为95.23%。© 2016 电 子 研 究 所 ( ERI ) 。 Elsevier B. V. 制 作 和 托 管 这 是 CC BY-NC-ND 许 可 证 下 的 开 放 获 取 文 章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:基因芯片;基因表达;信息增益;乳腺癌;决策树1. 介绍根据世界卫生组织(WHO)的数据,乳腺癌是发达国家和发展中国家妇女中最常见的癌症早期检测和存活是控制乳腺癌的重要问题(Shulman等人, 2010年)。诊断这种疾病的最重要和最准确的方法之一是对个体进行DNA分析DNA微阵列是研究基因表达的重要技术(Cano等人, 2009年)。 微阵列是一种载玻片,单链DNA分子附着在称为斑点的固定位置。在一个微阵列芯片上可以有数千个点,微阵列芯片上的每个点都包含多个相同的DNA链,这些DNA链可以识别一个基因。微阵列图像包含多个块(称为子网格),并且这些块由位于行和列中的许多点组成每个斑点是图像中的一个区域,其代表单个探针与样品之间的杂交水平*通讯作者。电子邮件地址:h. shahroodut.ac.ir(H. Hassanpour)。电子研究所(ERI)负责同行评审http://dx.doi.org/10.1016/j.jesit.2016.06.0012314-7172/© 2016电子研究所(ERI)。Elsevier B. V.制作和托管这是CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348349Fig. 1.使用微阵列图像和图像处理技术进行乳腺癌分类。两个样品的杂交实验由以下步骤组成:首先,来自两种不同条件下的细胞(例如,健康细胞和癌细胞)的总mRNA(信使RNA)用两种不同的荧光标记(通常为cy3和cy5)染色。其次,将标记的样品在微阵列上洗涤。这些标记的基因产物与斑点中的互补序列杂交(Stekel,2003)。每个斑点的强度表示样品与已知基因的杂交程度,从而指示特定基因的表达基因表达谱芯片技术已用于肿瘤的分类和诊断预测。将图像转换为基因表达矩阵,其中行对应于基因,列代表样品或试验条件(Gunavathi和Premalatha,2014)。微阵列分析的关键步骤包括图像处理和数据分析(图1)。图像处理是微阵列实验中的一个重要步骤,它可以提高数据微阵列分析的准确性,包括聚类。在图像处理步骤中,从微阵列图像中定量基因表达水平分四个步骤进行,包括旋转识别,子网格检测,网格化和计算基因表达。子网格检测涉及将块划分为图像中的不同单元,然后为每个块分配坐标,并且在每个子网格中,图像中的各个点被隔离。通过使用每种染料的两个强度之间的对数比来考虑到早期阶段的错误可能导致不正确的结果,因此网格化是后续任务中最重要的步骤。在数据分析步骤中,预测乳腺癌的两个步骤包括:特征选择和肿瘤分类方法。特征选择或基因选择是将大量数据分析并总结为有用信息的过程。这些信息可以用来降低成本。一般的特征选择和分类应用工具用于分类任务。在本文中,一个最广泛使用的基因选择方法,信息增益(IG),采用提取有用的知识,从微阵列数据。IG方法可以快速拒绝大量非关键噪声和不相关基因,因此,细化基因的最佳子集的搜索区域(Cho和Won,2003;Wang等人,2006年)。此外,在我们提出的系统中,决策树被开发来诊断两个子类肿瘤。本文的结构安排如下:在第二节中,网格和特征选择和分类方法进行了审查。第3节包含乳腺癌数据集的简短描述 图像处理和数据分析方法见第4节。第五部分是本研究的结论。2. 相关工作本节的主要目的是提供一个简单的回顾不同的基本步骤的工作,网格,基因选择和肿瘤分类使用微阵列图像和微阵列基因表达数据。由于特征的数量远大于样本的数量,因此有效地分析DNA微阵列数据至关重要。许多图像处理,机器学习和数据挖掘方法已被用来克服这个困难。2.1. 网格化网格化是初始阶段最重要的任务,如果正确完成,将大大提高后续阶段的效率。近年来,已经有方法和软件包可用于处理一个350N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348或一些问题,最重要的是它们都需要由用户设置几个参数;例如软件如ScanAlyze、GenePix Pro6和ImaGene(Bariamis等人,2010;Fouad等人,2014年)。Angulo和Serra(2003)提出了一组无监督算法,用于使用形态学算子从DNA微阵列中快速准确地提取点数据。在这种方法中,有一些缺点,必须解决之前,完全自动网格化可以发生。例如,此模型要求网格行和列严格与x轴和y轴对齐。在Katzer et al. (2003)通过马尔可夫随机场(MRF)技术对原始荧光微阵列图像进行自动网格分割。这种方法不适合微阵列网格化,因为完全搜索最佳MRF配置是不可行的。Zacharia和Maroulis(2008)利用支持向量机(SVM)对微阵列图像进行网格化。该方法利用一组软边界支持向量机,通过最大化线与点之间的边界来预测DNA微阵列网格中的线Feng等人(2015)讨论了基于图像投影变换和功率谱分析的微阵列图像网格化方法。本文首先将二维微阵列图像转化为垂直和水平一维投影序列,然后利用低通滤波、零均值、FFT和周期图法功率谱估计等信号处理方法获取点阵列行和列跨度信息,最后根据点阵列的局部极大值和跨度信息实现微阵列图像网格化。2.2. 基因选择基因表达数据的主要限制是其高维数,包含数千个基因和非常少的样本(Gunavathi和Premalatha,2014)。 许多研究人员已经转向数据挖掘技术和机器学习方法来预测乳腺癌。在1995年(Wolberg等人, 1995)数据挖掘和机器学习方法被嵌入到用于诊断乳腺癌的计算机辅助系统中。最近的研究(Wong和Hsu,2008)表明,少量的基因足以准确诊断大多数疾病,即使基因的数量在不同疾病之间变化很大因此,基因选择在所提出的系统中起主要作用(Horng等,2009年)。一些现有的方法提出了一种混合系统来获得一小组高度区分的基因;例如,Min Xu(XuandSetiono,2003)所做的工作已经从单变量最大似然方法(LIK)和多变量递归特征消除(RFE)方法设计了混合方法。最广泛使用的基因选择方法,信息增益(Cho和Won,2003;Wang等人,2006年),是为了这项工作。信息增益利用基因在相应类中的存在和不存在来度量基因的优良性。2.3. 分类分类是在数据库中的一组对象中找到共同属性并将其分类为不同类别的任务(Chen等人, 1996年)。 在文献中,统计方法如boosting和自组织映射(Golub等人,1999)、K-最近邻分类(Li等人,2001)、区分方法(Dudoit等人,2002)、决策树、多层感知器(Khan等人,2001; Xu等人, 2002)、最小二乘和逻辑回归(Fort和Lambert-Lacroix,2005)、朴素贝叶斯方法(Fan等人, 2009)和使用用于癌症分类的模糊K最近邻的主动学习(Halder等人, 2015)用于生成基因表达数据的分类器模型。最近已经在微阵列数据上测试了混合方法(Lee和Leu,2011),获得了高分类精度。例如,Mahmoud和Basma(2014)提出的方法与两个机器学习分类器集成; K-最近邻(KNN)和支持向量机(SVM);对微阵列基因表达进行分类。本文采用决策树作为分类器。所提出的方法的性能进行评估,使用基因表达数据集,即,2型乳腺癌(Kao等人,2009; Bergamaschi等人, 2006年)。3. 数据集用于评估所提出的方法的数据集由来自斯坦福微阵列数据库(Stanford,2015)的71个与乳腺癌相关的DNA微阵列图像组成。 图像以16位灰度的TIFF文件存储N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348351∫−=×表1所提出的方法在旋转图像上的精度。角度精度旋转调整图片51769图片51865100% 100%0.7599%98.67%0.5-99% 98%0.25升98% 98%−1100% 99%-0.7599. 3% 98%-0.599% 100%-0.2598. 6% 98%水平深度每个样品的荧光分离图像分为两个通道,ch1(cy5)和ch2(cy3)。这些图像包括48个区块,约870个点,图像中总共有41,760个点。有22个与原发性乳腺肿瘤相关的样品,其中细胞生长至70 -80%汇合,然后收获用于总RNA和基因组(Kao等人, 2009)DNA和其余与乳腺肿瘤标本相关的DNA来源于49名接受基于阿霉素或氟尿嘧啶-丝裂霉素的新辅助化疗的局部晚期(T3/T4和/或N2)乳腺癌患者(Bergamaschiet al., 2006年)。乳腺癌数据已经分为训练集和测试集。有50个训练样本和21个测试样本。21个测试集包含5个1类和16个2类样本。此外,50个训练集包含17个1类样本和33个2类样本。4. 系统和方法4.1. 旋转调节在扫描过程中,微阵列图像经常会发生偏斜,很可能是因为芯片微阵列没有正确地放置在微阵列扫描仪内。相对于x轴,在两个不同的顺时针方向上看到图像的旋转Radon变换用于找到图像中的旋转角度(Rueda和Rezaeian,2011)。 Radon变换g(ρ,τ)是连续二维函数f(x,y)在一组斜线上的积分(Smith,1995):g(ρ,τ)=+∞f(x,ρx+τ)dx(1)−∞Radon变换是线性的这是一个重要的性质,可以用来近似的变换,通过计算机程序。另外,已知原始图像的Radon变换和仿射变换参数,可以获得旋转、缩放或平移图像的图2示出检测旋转角度1.5°,1.5分,以及他们的修正。尽管数据集仅包括具有几度旋转的微阵列图像因此,为了测试拉东变换的效果,选择倾斜角为0°的前两个图像。然后,我们在顺时针和逆时针方向上旋转图像0.25,0.5,0.75和1度表1示出了所提出的方法在两个旋转图像上的准确度这表明了该方法在显著旋转图像中的有效性和鲁棒性。算法准确度的计算方法如等式(1)所示。(二):精度|θreal− θest|一百(二)θ实数4.2. 亚网格检测图像阈值分割是图像处理中应用最广泛的技术之一,在图像分割、分类和目标识别等领域有着广泛的应用。所提出的子网格方法是指352N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348图二、(a)检测旋转角度= 1.5°。(b)检测旋转角度=−1.5°。(c)纠正结果。在微阵列图像内定位每个子阵列(Rueda和Rezaeian,2011)。精确定位子阵列所需的全局参数是每个子阵列的宽度和高度以及它们之间的间距。根据子网格,计算像素灰度的行或列均值,得到一维函数绘制了一维图其域反映像素的行/列的位置在这项工作中,该函数被认为是一个直方图,其中每个bin代表一列(或行)。最后,通过局部最小值计算块之间的该方法可以处理各种类型的噪声图像。为例如,带有黑色区域的图像意味着在扫描期间丢失了一些斑点 图图3显示了将包含12 × 4子网格的微阵列图像网格化的步骤,以及相应的行或列和。4.3. 网格化网格化是一个重要的步骤,它指示各个点的坐标。所提出的网格化方法最初试图去除微阵列图像中的大闪光噪声(Fouad等人,2013年)。微阵列图像网格化复杂,存在噪声、灰度低、对比度差等因此,我们提出了预处理步骤,通过应用直方图均衡化函数来产生前景(斑点)和背景之间的高对比度但是这种方法可能会增加背景噪声的对比度,因此我们采用维纳滤波来消除它(Acharya和Ray,2005)。为了去除大光斑噪声,首先应用具有结构元素的腐蚀算子来去除前景斑点。通过从原始图像中减去产生的背景来获得噪声较小的图像。这主要是由于去除了大的耀斑噪声。之后,应用具有结构元素的形态学开口来去除图像中的小尖峰N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348353图三.乳腺癌数据集微阵列图像中的子网格检测。354N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348.=见图4。去除耀斑噪声的子网格点检测。表2所提出的方法对网格化图像的精度图像精度图片51786百分百图片51771百分之九十八点八三图片54846百分之九十九点七六我们搜索了一个规则的斑点网格,所以我们首先考虑图像每列的平均强度之后,我们计算图像的每列的平均强度(Labib等人,2012年)。为了获得图像f(x,y)(维度x和y)的平均水平强度分布MH(y),公式定义如下:x=X−1MH(y)1= xx=0 f(x,y)(3)我们可以使用间距估计来帮助设计滤波器,以从强度分布中去除背景噪声因此,使用自相关来增强轮廓的自相似性。这一结果对光斑间距的估计有一定的促进作用。然后我们提取峰的质心。这些对应于斑点的水平中心。相邻峰之间的中点提供网格点位置。这些参数用于确定垂直网格的位置并将其绘制在图像上。我们简单地转置图像,重复上面使用的所有步骤,以获得图像上的水平网格。微阵列点网格显示在图1A中。四、提出的网格化方法在乳腺癌的噪声微阵列图像上实现本工作所得结果见表2。在指定输入图像上应用的网格化方法的精度可以计算如下:准确度N(校正斑点)100(4)N(总斑点)4.4. 测量基因表达DNA微阵列在医学中的应用主要有几种类型。第一个涉及发现预定义的样品组之间的表达水平的差异。这就是所谓的“阶级比较”实验。一旦微阵列已经杂交,所得到的图像用于生成数据集。该数据集需要在分析和解释结果之前进行“预处理”。预处理是提取或增强N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348355.=Mv-我是说...200c..200c.J=1图五.显示从一个cDNA阵列(双通道技术)获得的表达谱数据。(a)现场原始强度。(b)使用Cy3(绿色)和Cy5(红色)的双通道微阵列实验中的斑点对数转换。有意义的数据特征,并为数据分析方法的应用准备数据集预处理的一个典型示例是原始强度值的对数(Tarca等人,2006年)。在使用Cy3(绿色)和Cy5(红色)的双通道微阵列实验因此,光斑强度等于像素强度之和然后,通常对数据进行对数转换。 对数变换改善了数据分布的特征,并允许使用经典的参数统计进行分析,如图5所示。因此,使用对数转换强度和比率的原因包括:(1)在强度范围内更均匀地分布特征,(2)在强度范围内使可变性更恒定,以及(3)导致强度和实验误差接近正态分布。对于双通道阵列,两个竞争样品的强度值表示为比率,然后进行对数变换。将每种染料的两个强度之间的对数比用作基因表达数据(Labibet al.,2012年):基因表达log 2int(cy5) (5)int(cy3)其中int(cy5)和int(cy3)是红色和绿色的强度(图像中的通道1,2由于至少有数百个基因被放在DNA微阵列上,它是如此的有帮助,我们可以在短时间内调查全基因组信息。5. 基因选择如前所述,特征的数量远大于样本的数量。大多数基因与分类性能事实上,大量的基因表达特征集合将具有更高的计算成本和更慢的学习过程。有研究表明,只有几个基因就足够了。因此,关键是要认识到少量的基因是否足以进行良好的分类(Li和Yang,2002)。信息增益技术使用香农熵的概念给定熵E作为一组训练样本中的杂质的度量 该度量简单地是通过根据该特征划分数据而引起的熵的预期减少,即所谓的信息增益(Wang等人, 2006年)。假设给定的一组微阵列基因表达数据M,基因i的信息增益定义为:IG(M,i)=E(M)−MvE(M),(6)v∈V(i)其中V(i)是特征i的所有可能值的集合,Mv是特征i具有值v的M的子集,E(M)是整个集合的熵,并且E(Mv)是子集Mv的熵。熵函数E定义为:CΣ|CJ| log2|CJ|、(7)哪里|CJ|是类Cj中的样本数。E=356N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348Σ表3通过IG选择的乳腺癌基因。源野基因IDIG值秩基因名称30216ASCL1::PAH0.7531无毛鳞片复合物同系物1(果蝇)::苯丙氨酸羟化697SETBP 1::SETBP 10.7222SET结合蛋白1::SET结合蛋白128275PSCA::PSCA0.7073前列腺干细胞抗原::前列腺干细胞抗原8737PRKAR2A::PRKAR2A0.7074蛋白激酶,cAMP依赖性,调节性,II型,α::蛋白质激酶,cAMP依赖性,调节性,II型,α1369ELF4::ELF40.6965E74样因子4(ets结构域转录因子)::E74样因子4(ets结构域转录因子)8728–0.6886转录位点21867MBP::MBP0.6827髓鞘碱性蛋白::髓鞘碱性蛋白20044UROS::UROS0.6828尿卟啉原III合酶9679–0.6829全长插入cDNA克隆YF46C0818945RNF138::RNF1380.67910Ring finger protein 138::Ring finger protein 138熵应该以比特为单位给出所需的信息,传统上用于处理布尔值特征(热/冷,真/假等)。幸运的是,该方法可以扩展到处理具有连续值特征的数据,例如,微阵列基因表达数据。这种方法表明,只有少数基因具有关于疾病的重要信息,其余基因的信息量非常低关于表明仅少数基因足以理解其与目标疾病的生物学关系的研究,选择具有较高IG值的数百个基因作为信息基因。表3给出了使用IG为乳腺癌数据集选择的基因的细节(仅显示了主要的10个基因)。5.1. 分类本文采用决策树算法对数据集进行决策树(HanandKamber,2001)是一种分类方法,它将标记的训练数据分类成树或规则。决策树的主要优点之一是能够生成可理解的知识结构,即,该模型具有以下优点:使用分层树或规则集,在应用该模型预测或分类新病例时计算成本低,能够处理符号和数字输入变量,明确指出哪些属性对预测或分类最重要(He和Hui,2009年)。本文使用的是j48树这个树是C4.5的一个稍微修改的版本 该算法是Quinlan(1986)开发的ID3的继承者。C4.5中选择分裂属性的默认标准是信息增益比。这个准则用于采用熵测度作为杂质测度。在树C4.5中,属性值被分为两组,以基于所选阈值来处理连续属性,使得所有高于阈值的值被视为一个子项,其余的被视为另一个子项。C4.5使用增益比作为属性选择度量,当一个特征有许多结果值时,它消除了信息增益的偏差计算每个特征的增益比,然后根节点将是增益比最大的属性在决策树中使用悲观修剪去除不必要的分支,以提高分类的准确性C4.5分类树可以分为两部分,使用训练数据学习和使用测试数据分类该结构以语句的形式存在,包括。. . 使用逻辑语句的一个优点是它便于编码到其他程序中,因此代码可以很容易地重复使用。信息增益、熵和增益比的三个概念在下文中描述(Patidar等人,2015年;AlSnacks等人, 2011年)。令c表示类的数量,p(S,j)表示S中分配给第j个类的实例的比例因此,熵计算如下:C熵(S)= −p(S,j)×logp(S,j)(8)j=1N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348357=×|Ts||Ts|见图6。乳腺癌诊断因此,训练数据集T的信息增益被定义为:Gian(S,T)=熵−|熵(Sv),(9)|Entropy (Sv),(9)v∈ Value(Ts)|Ts|其中Value(Ts)是S在T中的值的集合,Ts是由S和Ts导出的T的子集,v是T的子集,其中属性S的值为v。因此,属性S的信息增益比被定义为:增益(S,T)GainRatio(S,T)=SplitInfo(S,T)(10)其中SplitInfo(S,T)计算为:SplitInfo(S,T)= −.. Ts,v.×log g. Ts,v. 中国(11)(v=值(Ts))在决策树方法中,提供了大量的统计信息,包括真阳性(TP),假阳性(FP),真阴性(TN),假阴性一起(FN)。利用该量,使用等式(Eq. (十二):准确度TP+TNTP+TN+FP+FN(十二)图6示出了用于乳腺癌的子类诊断的决策树。三基因决策树方法在乳腺癌类型的诊断阶段给出了100%的分类准确率。6. 结论在本文中,我们提出了一个系统,从图像芯片的数据提取和分类与乳腺癌相关的原始数据,它一般包括六个步骤。第一步的目的是纠正图像内检测到的任何旋转。然后,使用图像阈值技术来检测包含以下内容的各个子网格的正确数量:124个子网格。在第三步中,使用形态学算子去除大的闪光噪声。然后,平均行或列的强度计算和自相关的实施,以提高自相似的配置文件。最后,为每个点绘制单独的线。第四步说明如何通过使用每种染料的两个强度之间的对数比作为基因表达数据来计算基因表达值。在第五步中,当少量基因足以准确诊断大多数癌症时,使用信息增益方法来减少基因的数量作为下一步,实施决策树方法来对乳腺癌微阵列数据进行分类。总的来说,所提出的系统的优点是,网格化性能已成功的图像时,满足以下条件:低强度,质量差的斑358N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348点,噪声和文物,以及旋转。通过形态学算子消除了噪声伪影此外,该方法的推广性能N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348359允许在存在弱表达点的情况下测定网格线而在超过98%的情况下,斑点完全位于其各自的网格单元内,仅在少数图像中具有明显的噪声和缺陷,导致精度低于98%。在该系统中,图像在数据分析步骤中,使用乳腺癌图像数据集证明了所提出的系统的有效性该系统具有3个基因,分类准确率为95.23%。所提出的方法导致一个高的分类准确率系统的乳腺癌数据集。这种方法可以作为一种工具,以克服微阵列基因表达数据分类的局限性。这种方法最重要的优点之一是从图像中提取数据,而以前的方法已经使用已发布的数据集来分类各种类型的微阵列数据。引用Acharya,T.,雷,A.K.,2005年 图像处理:原理与应用。 约翰·威尔和儿子们(第6章)Al Snarrow,M.B.,El-Deeb,H.M.,Badran,K.,艾尔·克里尔,内务部2011年。一套基于决策树的癌症基因表达数据分类算法。埃及告知。J.12(2),73-82.Angulo,J.,Serra,J.,2003. 使用数学形态学自动分析DNA微阵列图像。Bioinformatics19(5),553-562. Bariamis,D.,Maroulis,D.,Iakovidis,D.K.,2010年。DNA微阵列图像的无监督SVM网格化。Comput. Med. 成像图。34(6),418-425。Bergamaschi,A.,Kim,Y.H.,王,P.,Sørlie,T.,Hernandel-Boussard,T.,隆宁,体育,Tibshirani,Børresen-Dale,A.L.,Pollack,J.R.,2006. 不同的DNA拷贝数改变模式与不同的临床病理特征和乳腺癌基因表达亚型有关。染色体癌症45(11),1033-1040。卡诺角,加西亚,F.,洛佩兹,F.J.,Blanco,A.,2009年 利用主成分和分布估计算法分析微阵列数据的智能系统。专家系统应用36(3),4654-4663。Chen,M.S.,汉,J.,余,附,一九九六年。 数据挖掘:从数据库的角度来看。 IEEE Trans. 克诺湾 数据工程师 8(6),866-883。Cho,S.B.,Won,H.H.,2003. 用于癌症分类的DNA微阵列分析中的机器学习。在:第一次亚太生物信息学会议的生物信息学,阿德莱德,澳大利亚,页。189-198.Dudoit,S.,Fridlyand,J.,斯比德,TP 2002. 利用基因表达数据进行肿瘤分类的判别方法比较。J. Am. Stat. Assoc.97(457),77-87。范湖,加-地Poh,K.L.,Zhou,P.,中国科学院院士,2009年一种用于微阵列数据朴素贝叶斯分类的序贯特征提取方法。 专家系统 Appl.36(6),9919-9923。冯,Y.,宋,K.,刘杰,2015. 基于投影变换和功率谱分析的微阵列图像网格化方法。在:2015年计算机与信息学国际研讨会,北京,中国,pp. 44比51Fort,G.,Lambert-Lacroix,S.,2005年 使用惩罚逻辑回归的偏最小二乘分类。 Bioinformatics 21(7),1104-1111. 福阿德内务部Mabrouk,M.S.,Sharawy,A.A.,2013年。提出了一种利用去噪技术对含噪cDNA微阵列图像进行网格化的新方法. Int. J.Comput. Appl.63(9),36-44.福阿德岛Mabrouk,M.,Sharawy,A.,2014年。使用不同方法对网格化cDNA微阵列图像进行自动准确分割。Adv. Comput. 4(2),41-54。戈卢布,T.R.,Slonim,D.K.,Tamayo,P.,Huard,C.,Gaasenbeek,M.,Mesirov,J.P.,Lander,E.S.,1999. 癌症的分子分类:通过基因表达监测进行分类发现和分类预测。科学286(5439),531-537。Gunavathi,C.,Premalatha,K.,2014. 基于kNN和SVM的遗传算法在肿瘤分类特征选择中的 性 能 分析Int. J. Comput. 电子 自动 控制通知。 Eng. 8(8),1490-1497。Halder,A.,Dey,S.,库马尔,A.,2015年。使用模糊k-NN的主动学习用于来自微阵列基因表达数据的癌症分类。在:AdvancesinCommunicationandComputing,Springer,India,pp. 103-113汉,J.,Kamber,M.,2001年 数据挖掘:概念与技术。第九章:第一次见面他,Y.,许氏,S.C.,2009年 探索基于蚁群算法的基因表达数据分析。 第内特尔 Med. 47(2),105-119。洪,J.T.,Wu,L.C.,Liu,B.J.,郭,J.L.,郭文雄,Zhang,J.J.,2009年 一个基于决策树基因选择的芯片基因表达数据分类专家系统。ExpertSyst.Appl.36(5),9072-9081。Kao,J.,Salari,K.,Bocanegra,M.,蔡耀龙,吉拉德湖,Gandhi,J.,Kwei,K.L.,Hernandel-Boussard,T.,王,P.,Gazdar,A.F.,Minna,J.D.,Pollack,J.R.,2009. 乳腺癌细胞系的分子谱确定了相关的肿瘤模型,并为癌症基因发现提供了资源。PLoSOne4(7).Katzer,M.,Kummert,F.,Sagerer,G.,2003年。微阵列网格化的一种Markov随机场模型。在:第18届ACM应用计算研讨会,pp。72比77Khan,J.,魏,J.S.,Ringner,M.,Saal,L.H.,Ladanyi,M.,Westermann,F.,Meltzer,P.S.,2001年 利用基因表达谱和人工神经网络进行癌症分类和诊断预测。Nat.Med.7(6),673-679。Labib,F.E.Z.,福阿德岛Mabrouk,M.,Sharawy,A.,2012年。 一种有效的全自动化微阵列图像网格化方法。Am. J. BioMed.Eng.2(3),115-119.Lee,C.P.,Leu,Y.,2011年。 一种新的用于微阵列数据分析的混合特征选择方法。 Appl. 软计算 11(1),208-213。360N.D. Khalilabad等人/Journal of Electrical Systems and Information Technology 3(2016)348李伟,杨,Y.,2002年。判别式微阵列数据分析需要多少基因。微阵列数据分析方法。 SpringerUS,pp. 137-149。Li,L.,温伯格,C.R.,达登,T.A.,佩德森,L.G.,2001. 基于基因表达数据的样本分类的基因选择:遗传算法/KNN方法参数选择敏感性研究Bioinformatics17(12),1131-1142.马哈茂德,上午,巴斯马,上午,2014. 一种增强微阵列数据癌症分类的混合约简方法。Int.J.Adv. Res. 第内特尔3(10).Patidar,P.,Dangra,J.,Rawar,M.K.,2015年。教育数据挖掘的决策树C4.5算法及其改进 Int. J. 未来的趋势工程技术。2(2),14-24.昆兰,J.R.,一九八六年 引入决策树。 J. 马赫学习. 1(1),81-106。鲁埃达湖礼萨岛,2011年。cDNA微阵列图像的全自动网格化方法。 BMC Bioinform. 12(1),113.Shulman,L.N.,威利特,W.,Sievers,A.,Knaul,F.M.,2010. 发展中国家的乳腺癌:提高生存率的机会。Oncol.2010,1-6。史密斯,R.,一九九五年 一种简单有效的基于特征行累加的skew检测算法。在:第三届文件分析和识别国际会议论文集,IEEE,卷。2,Montreal,Canada,pp. 1145-1148。斯坦福微阵列数据库,http://smd.stanford.edu/(最后一次访问于2015年12月Stekel,D.,2003. 微阵列生物信息学。北京:清华大学出版社.Tarca,A.L.,罗梅罗河Draghici,S.,2006. 基因表达谱芯片实验分析。Am. J.奥斯特特妇科学195(2),373-388。王志,帕拉德,五,徐,Y.,2006年。神经模糊集成方法用于癌症基因芯片表达数据分析。在:国际研讨会上Eving模糊系统,IEEE计算智能学会,Ambleside,英国,pp. 241-246沃尔伯格,W.H.,Street,W.N.Mangasarian,O.L.,一九九五年 图像分析和机器学习应用于乳腺癌诊断和预后。Anal.定量Cytol.Histol.17(2),77-87.黄泰泰徐正熙,2008年微阵列数据的两阶段分类方法。 专家系统 Appl. 34(1),375-383。徐,M.,塞蒂奥诺河2003年。 使用单变量和多变量特征选择方法的混合进行癌症分类的基因选择。 Appl.蛋白质组学2,79-91.徐,Y.,Selaru,F.M.,Yin,J.,邹,T. T.,Shustova,V.,莫里,Y.,Meltzer,S.J.,2002年。 人工神经网络和基因过滤区分Barrett食管和食管癌的整体基因表达谱。CancerRes.62(12),3493-3497.Zacharia,E.,Maroulis,D.,2008年一个原始的遗传方法,全自动网格化的微阵列图像。 IEEE Trans. Med. Imaging 27(6),805-813.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功