没有合适的资源?快使用搜索试试~ 我知道了~
玉米后代基因型的预测方法比较:逻辑回归和朴素贝叶斯 (2019)
农业中的人工智能1(2019)9玉米(Zea maysL.)基于两种概率方法的后代基因型:Logistic回归和朴素贝叶斯D. Sekaa,B.S.邦尼,A. N.Yobouéb,S.R.是的,文学士波古雷讷aaNanguiAbrogoua大学自然科学学院,02 B.P. 801,Abidjan 02,科特迪瓦b Jean Lorougnon Guédé大学环境科学学院,B.P. 150,天秤座,Colombia,Medellina r t i c l e i n f o文章历史记录:2018年11月11日收到2019年3月12日收到修订版2019年3月12日接受在线预订2019年3月21日保留字:Gaussian naïveBayesLogistic回归玉米基因型预测选择a b s t r a c t我们使用两种概率方法,高斯朴素贝叶斯和逻辑回归预测两个玉米品系的后代的基因型,BLC和JNE基因型,基于父母的表型性状我们用总体准确度和受试者工作曲线下面积(AUC)确定了两种模型的预测性能两种模型的总体准确度在82%至87%之间Logistic回归模型的受试者工作曲线下面积值为0.90或更高,高斯朴素贝叶斯模型为0.85或这些统计数据表明,这两个模型是非常有效的预测后代的基因型此外,这两个模型预测BLC基因型的准确性高于JNE基因型。BLC基因型似乎更同质,更可预测。混淆矩阵同质性的卡方检验表明,在所有情况下,两个模型产生相似的预测结果。这一发现与Mitchell(2010)的主张一致,Mitchell在理论上表明这两个模型本质上是相同的。使用逻辑回归,原始数据的每个子集或其相应的主成分产生完全相同的预测结果。AUC值可以被视为分析中考虑的每组表型性状的亲本-后代相似性© 2019作者出版社:Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍学习算法及其实现的发展带来了处理数据、从数据中提取信息以及制定决策基础的新方法这些学习算法的应用范围涵盖了人类活动的各个领域关于这些算法的开发和使用的文献比比皆是。Hastie等人(2001)和Webb(2002)对这些算法进行了很好的综述 Sambo等人等人(2012)开发了一种用于从全基因组SNP数据的分析中进行遗传生物标志物选择和受试者分类的算法。他们发现他们的算法在识别1型糖尿病生物标志物方面的分类准确性显着提高 Douglass等人(2016)使用具有小RNA深度测序数据和基因组特征的朴素贝叶斯分类器来鉴定大豆、桃、水稻和拟南芥中的植物miRNA。他们发现所有四种植物的分类器在识别miRNA方面都非常准确他们根据受试者工作特征(ROC)曲线的曲线下面积值来确定分类器他们报告的AUC值在0.9771和0.9980之间,其中拟南芥miRNAs的鉴定具有最高值。这些学习算法已经被广泛使用*通讯作者。电子邮件地址:seka. iugb.edu.ci(D. Seka)。在植物有机体的分类中也是如此。在大多数情况下,植物的识别基于叶属性,因为叶的形状、颜色和质地对于植物物种是特定的(El-Hariri等人, 2014),与植物和水果不同,植物在其存在期间总是携带功能性叶子(Siravenha和Carvalho,2015)。 Wu等人(2007)开发了一种算法,其使用具有图像和数据处理技术的概率神经网络用于自动叶片识别和植物分类。应用该方法对32种不同植物的叶片特征进行了分类,准确率超过90%。他们发现他们的算法执行速度快,易于实现,并且在植物识别和分类方面很有效。 Hemming和Rath(2001)构建了一个识别系统,将杂草与两种主要作物(卷心菜和胡萝卜)区分开来。在他们的实验中,他们最初使用了8个形态特征和3个颜色特征,然后进行特征选择,以确定区分杂草物种和作物的最相关特征。他们发现颜色特征有助于提高分类的准确性。他们报告说,51%到95%的植物被正确分类。白菜和胡萝卜的平均分类准确率分别Giselsson等人(2013)通过使用来自矢车菊和龙葵的幼苗图像的距离数据构建了表示形状特征的数据集。他们将距离数据拟合为高度勒让德多项式,并使用他们称为https://doi.org/10.1016/j.aiia.2019.03.0012589-7217/© 2019作者。出版社:Elsevier B.V.代表科爱通信有限公司公司这是一篇CC BY-NC-ND许可证下的开放获取文章(http:creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表农业中的人工智能期刊主页:http://www.keaipublishing.com/en/j ournals/artificial-intelligence-in-agriculture/10D. Seka等人 /农业人工智能1(2019)9 - 13Y1/1Legendre多项式特征集。他们收集了另一组数据,并将其命名为标准特征集。有了这两组数据,他们运行了四种分类算法。他们报告说,勒让德多项式特征集非常强大,与标准特征集相比,其与分类算法的使用导致98.75%的准确度,然而,他们建议对这种属性数据收集方法进行更多测试,以评估其真正价值。Siravenha和Carvalho(2015)探索了一种关于叶特征的数据收集方法,该方法涉及轮廓质心距离和使用快速傅立叶变换的数据转换。 他们应用特征选择技术进行降维,提高了分类精度。然后,他们使用各种分类法来识别植物。他们报告的分类精度范围从C4.5算法获得的65.14%到应用于主成分的模式网络算法获得的学习算法与其他统计方法相结合,对全基因组测序数量性状表型预测的进展做出了重要贡献Guzzetta等人(2010)解释了一种学习管道,它使用基于朴素弹性网络的L1L2正则化方法来预测表型。他们发现它在表型预测的准确性方面非常有效Zhao et al.(2016)使用机器学习方法来识别导致二项设置中品种分化的根性状 Lippert等人(2017)开发了预测表型性状的模型。他们将这些模型组合在一个机器学习模型中,用于从表型预测中重新识别基因组在所有的研究中,使用了不同的学习方法,在每种情况下,该方法的性能已被证明是非常令人满意的优秀预测或分类。Kell等人(2001)提到,所有的机器学习方法都有其优点和缺点,没有一种方法最适合所有情况。鉴于这些算法在识别和分类研究对象方面的高性能,我们进行了这项研究,以预测基于亲本表型性状的植物基因型这项研究还提供了一个数值证明的优雅在一片混乱中。在籽粒灌浆期的线性阶段,用连续取样的籽粒干重进行正交对比,确定灌浆速率(gf)为线性系数。在预测后代的基因型时,我们使用了两种分类方法:高斯朴素贝叶斯和逻辑回归。我们使用朴素贝叶斯算法来确定个体后代是BLC或JNE品系的后代的后验概率,给定其植株高度、叶片数、叶片宽度、叶片数和籽粒充实率的属性值。概率模型简化如下:5主类jA1;A2;1/1其中Class是具有结果BLC或JNE的类标签,而Ai是属性。该模型计算后代的后验概率,相对于它的血统,作为产品的类标签的先验概率和属性的条件概率相对于该类标签。 该模型在群体中受试者的预测或分类中的应用被认为是判别性的,而不是生成性的逻辑回归(Ng和Jorda n,2 0 01)。对 BLC 和 JNE 基 因 型 亲 本 的 测 量 也 用 于 拟 合 逻 辑 回 归 模 型(McCullagh和Nelder,1989)并确定模型的参数,以计算后代属于JNE或BLC基因型的后验概率主要类别jA1;A2;在类别变量为二项式的情况下,logistic回归假设的参数模型如下所示(Mitchell,2010):Pr.C lass<$BLC}。A1;A2;A3;A50.5。1Σ1/1Mitchell(2010)的演示表明,连续特征和逻辑回归本质上是相同的尽管一个是生成性的,另一个是歧视性的(Ng和Jordan,2001)。和1 expb0∑5bi Ai..Σ}}ex p。b0∑5biAi2. 材料和方法Pr级<$JNE。A1;A2;ex p。b∑5bA:我们使用两种玉米(Zea maysL.)菌株BLC和JNE。þ0þ1/1我我这两个品系的籽粒颜色不同来自BLC的籽粒是半透明的,给出白色籽粒的外观 来自JNE的籽粒是黄色的。 在这项研究中,BLC品系经历了三个周期的选择,以获得更长和更宽的叶、更多的叶和更高的植株,而JNE品系在每个周期后经历随机选择。通过用来自相同品系的几个雄性不育系的大量花粉授粉,获得来自每个品系的所选植物的种子在穗梢萌发后立即用纸袋保护,保证了控制授粉在2017年春季,来自两种基因型的第三代(本研究中的亲本)和第四代(后代)的种子在科特迪瓦阿比让的NanguiAbrogoua大学的实验站以两个因素(世代和品系)在完全随机实验中种植。我们给土壤施肥 每个实验单元由两个菌株中的任一个的4m长的行组成。两者之间的距离为0.75 m。这些地块进行了播种,并在种植后三周将其稀疏至42,000株/公顷。吐丝时,一块地中约50%的植株发育的穗长(ll)和穗最大叶宽(lw)按Cross(1991)的方法测定。我们测量了植物高度(ht),即从土壤水平的基部到雄性顶端的植物M it ch e ll(2010)说明了P r(C la s)的部分形式|A1,A2,.A5)正是高斯朴素贝叶斯分类器的假设所隐含的形式,在大多数情况下,这两种方法都会产生类似的结果。然而,应该注意,逻辑关系直接估计Pr(Class)的参数|A1,A2,... A 5),而Gaussian naïve Bayes直接估计Pr(C l as s)和Pr(A 1,A 2,... A 5)的参数|(Nga ndJordan,20 01).为了验证Mitchell(2010)的断言,即高斯朴素贝叶斯和逻辑回归产生相同的结果,我们通过迭代删除属性从原始数据中创建了几个子集及其主成分然后,我们根据保留的属性或每个子集的相应主成分,用两个模型中的每一个预测后代主成分是继承总变异性的原始观测的正交变换与使用原始变量相比,它们的使用应消除与属性之间独立性假设相关的任何偏差,并应有助于评估预测结果中的任何此类 我们进行了重要性排名(Kuhn等人,2017)的性状,关于他们的能力,区分两个类之间。我们计算了准确度、灵敏度、特异性(Tze-Wey,2003)和受试者工作特征曲线下面积最大值(Bradley,1997)等统计数据,D. Seka等人 /农业人工智能1(2019)9 - 1311PCPCOBSPC..} }个文件夹我π1/4i2σ20我 我Pr<$ JNE} A类;βobs<$Pr级<$ JNE Z;βpc1/11/1每个型号。我们用准确度和AUC值评估每个模型的性能在运行两个模型时,BLC基因型和−2− 2被认为是积极的阶级。我们使用统计软件R(R核心团队,2017)进行所有分析。w0¼Ln1πXμi1μi0:我3. 结果和讨论变量重要性排序技术(Kuhn等人,2017)在区分两种基因型的能力方面,将LW、GF和HT确定为数据集的属性中最重要的性状。它们的重要性值分别为0.85、0.82和0.72。该发现得到了逻辑回归模型分析的证实,该模型显示lw(p值=0.03888)、gf(p值=0.04667)和ht(p值=0.04942)是数据集中最显著的预测变量表1显示了5个属性的平均值和标准差ln在不同基因型和不同世代间变异较小在区分两种基因型的能力方面,它也排名最后,重要性值为0.56。我们使用原始数据的不同子集及其主成分来预测两个亲本的后代我们报道了当响应变量具有二元结果且预测变量为高斯分布时,这些概率与逻辑回归给出的概率完全相同。该实验的结果为Mitchell(2010)的演示和Bhowmik(2015)的模拟研究提供了数值证据。我们应该提到的是,日志记录可以直接对P r(C l a ss)的p am et er进行简化|Ai),以及高斯朴素贝叶斯直接估计Pr(Class)和Pr(Ai ) 的参 数|(Nga ndJordan,2001).表2表明,逻辑回归给出了完全相同的预测结果,无论我们使用原始数据的子集或其相应的主成分。这一观察结果的解释在于,具有原始数据的逻辑斯谛方程的右侧与具有主成分的逻辑斯谛方程的右侧完全相同表2中列出了两种模型在这些子集上的性能。使用卡方检验对每个子集上的模型生成的混淆矩阵进行比较(Kristi,2007;Hope,1968)。的考验11p.β^t1一个2.1英寸的x p。β^tZ混淆矩阵的同质性产生的p值范围为0.7692至1.000,证明了预测值的高度相似性这导致这两种模式的形式。Gaussian naïve Bayes利用子代的当前证据更新来自父代的先验知识,^tOBSA¼β^tZ计算一个后代属于一个基因型的条件概率。并且,逻辑回归用父母的表型值估计模型的参数以计算相同的条件概率。然而,Mitchell(2010)给出了一个详细而优雅的证明,在具有参数π = Pr(Y =“正类“)的二元响应变量(Y)的某些条件下,关于Y条件独立的高斯分布属性(Ai),Pr(Ai|Y=yk)<$N(μik,σi),则在Ga usin下的所有约束条件都是一致的朴素贝叶斯模型可以写成参数形式,其中β^t是来自原始数据的估计回归系数的向量,A是由原始变量s的子集形成的矩阵,是由主成分估计回归系数的向量,Z是由原始数据子集导出的主成分矩阵。因此,我们认为,Pr.C lass<$}BLC}A;βobsPr.ClasBLC}Z;βpc和Pr.C la s<$BLC}。A1;A2;11 p.w∑wA..- 是的.Σ和..P.w0Σ5}}wi Ai利用高斯朴素贝叶斯,从原始数据的子集及其相应的主成分中获得的混淆矩阵但差异不显著(p值≥0.8227)。Pr级<$JNE。A1;A2;¼1哪里wμi0−μi1σ2表1P.w0∑5wi Ai所有测试数据的总体预测准确度范围为82%至87%(表2)。曲线下面积的值在0.85和0.93之间。一般而言,两种模型预测BLC基因型的准确性高于预测JNE基因型。这两个模型所观察到的相对较低的特异性和较高的敏感性可能与BLC和JNE种群的结构以及它们是如何发展的有关BLC群体用针对宽和长的叶、大量的叶和更高的植物的选择程序开发三个周期的选择可能有助于部分实现这一目标。除了在,更多的特点BLC基因型的个体已经发展出独特的特征,亲本和子代的lw、ll、ln、ht和gf的平均值和标准差由遴选标准界定,并已逐步形成一个性状亲本后代BLCJNEgf(mg·d1)5.41(0.32)更同质的组,模型预测更好。 Kudaravalli等人(2009),Bersaglieriet al. (2004),Enattah等人(2005)和Tishkoff et al. (2007)报告了选择对性状影响的确证证据。他们证明了自然选择或人工选择影响了基因的表达,这些基因被翻译成改良的表型。 和Wang等人(2018)发现玉米叶宽受显性基因控制,与基 因 不连锁OBSβ5我1/1:这两个模型都取得了很好的预测效果。的长(厘米)9.66(0.61)8.34(1.18)9.47(0.67)8.93(0.82)ll(cm)89.30(6.47)84.34(7.36)89.90(5.23)85.16(5.86)ln(cm)12.43(1.61)12.13(1.11)12.73(1.05)12.20(1.19)ht(cm)235.87(23.59)216.57(24.32)231.50(21.12)218.40(21.12)−4.98(0.34)5.49(0.30)5.10(0.40)12D. Seka等人 /农业人工智能1(2019)9 - 13表2逻辑回归(LR)和高斯朴素贝叶斯(GNB)模型的预测特性与原始数据及其主成分的子集数据属性模型混淆矩阵AUC准确度卡方(p值)TPFNTNFP原始数据(a)lw+ll+ln+ht+gfLR2642370.900.820.9674GNB2732460.900.85(b)lw+gf+ht+llLR2732280.930.821.000GNB2732280.910.82(c)lw+gf+htLR2732280.930.820.9931GNB2732370.900.83(d)gf+htLR2642640.930.870.8868GNB2462730.920.85(e)lw + gfLR2732370.910.830.9835GNB2642370.890.82主成分pc1+ pc2+ pc3+ pc4+ pc5从(a)LR2642370.900.820.9931GNB2642280.850.80pc1+ pc2+ pc3+ pc4从(b)LR2732280.930.820.8227GNB28219110.860.78pc1+ pc2+ pc3从(c)LR2732280.930.821.000GNB2732280.900.82pc1+ pc2从(d)LR2642640.930.870.7692GNB2372550.900.80pc1+ pc2从(e)LR2732370.910.830.9690GNB2642280.900.80TP=真阳性; FN=假阴性; TN=真阴性; FP=假阴性。注:pc i(i= 1,2,...,5)为主成分。(s)控制玉米叶长。这一论断意味着玉米叶宽可以通过选择来改变,而对冠层的其他性状没有任何直接本研究的结果支持这一论断。在本研究中,BLC基因型玉米叶宽和株高的相对增加可以归因于选择更宽的叶和更高的植株的直接效应因此,这两个性状成为两个群体之间最重要的区分性状与JNE基因型相比,BLC基因型的灌浆速率较高,这可能归因于对冠层大小的间接选择另一方面,随机选择JNE基因型结果表明,所测性状的变异性较大,JNE基因型个体的同质性相对较低。JNE菌株的特征相对较大的分散导致模型的特异性降低。许多JNE菌株的个体具有与大多数BLC基因型特征相似的性状,并且模型将它们鉴定为属于BLC基因型类别然而,JNE基因型的大多数个体保留了他们的性状,并且模型正确地预测了这些个体。4. 总结和结论我们使用田间数据,使用逻辑回归和高斯朴素贝叶斯预测两个玉米品系的后代基因型总体预测准确率为78%~ 87%,受试者工作特征曲线下面积为0.85 ~ 0.93。灵敏度,定义为BLC基因型的正确识别是高的,高斯朴素贝叶斯和逻辑回归的模态值为0.90。另一方面,作为JNE基因型的正确鉴定的物种的模态值为0.73对于Gaussian naïve Bayes和logistic回归。两种方法的敏感性较高,特异性较低,主要是由于两个群体的结构而不是检测方法的质量。与JNE群体相比,BLC群体更同质,更容易识别,JNE群体更多样,其后代中有很高比例被误分类为BLC基因型。对子代基因型的预测检验更多的是对亲子相似性的检验。模型以亲本表型值为训练样本,识别具有相似性状的后代 对于单个预测变量或属性,来自此类测试的受试者工作特征曲线下的面积可以是以下各项的良好预测因子:遗传性Wray等人(2010年)制定了一个方程,该方程将受试者工作特征曲线下的最大面积与遗传力和性状的患病率相德莱弗斯等人(2012)提到,测试的准确性是该测试中考虑的性状的遗传力的直接反映。他们补充说,具有高遗传力的表型性状将以高准确度进行预测,而具有低和非显著遗传力的性状将不会导致高预测准确度。该性状受遗传因素影响较小,受环境因素影响较大在本研究中,几个表型性状被认为是在确定后代的基因型。我们不能推断AUC值是遗传度的良好估计相反,我们可以将本研究中的AUC值视为亲子相似性的良好指标或标准AUC值越高,亲本与子代之间的相似性越大我们使用了几个数据子集及其相应的原理-pal组件进行基因型预测测试。对于每个数据集,比较逻辑回归和高斯朴素贝叶斯预测结果的卡方检验表明,两种模型产生相似的预测性能。我们的现场研究结果与Mitchell(2010)的发现和Bhowmik(2015)的工作一致。 使用逻辑回归,使用数据子集或其相应的主成分给出了完全相同的预测结果。 主成分保留了数据的总变异性,数据矩阵与子集估计回归系数向量的乘积与主成分矩阵与主成分估计系数向量的乘积相同。使用高斯朴素贝叶斯,数据子集或其相应的主成分的预测结果并不总是完全相同。但在有差异的地方,差异并不显著。利益冲突通讯作者代表所有作者声明不存在利益冲突。引用Albersti,A.,2007年 分类数据分析导论。第2版 John Wiley &Sons,New York,p. 38岁。D. Seka等人 /农业人工智能1(2019)9 - 1313Bersaglieri,T.,Sabeti,P.C.,帕特森,N.,Vanderploeg,T.,Schaffner,S.F.,德雷克,J.A.,Rhodes,M.,Reich,D.E.,Hirschhorn,J.N.,2004年。乳糖酶基因最近强阳性选择的遗传特征。Am. J.哈姆。Genet. 74,1111-1120。Bhowmik,T.K.,2015年。 朴素贝叶斯与逻辑回归:理论,实现和实验验证。内特尔第18(56),14-30。布拉德利,AP,一九九七年。 ROC曲线下面积在机器学习算法评估中的应用。模式识别。30,1145-1159.卡隆,医学博士,拉塞尔,西弗吉尼亚州,一九八七年不同育种时期四个玉米品种对密度和氮素水平的反应。作物科学27,465-470.克罗斯,HZ,1991. 膨叶率对早熟玉米产量及其构成因素的影响。作物科学31,579-58 3.Douglass,S.,许世文,Cokus,S.,Goldberg,R.B.,原田,J.J.,Pellegrini,M.,2016年。 一种用于鉴定植物microRNA的朴素贝叶斯分类器。Plant J. 86(6),481-492.德莱弗斯,J.M.,Levner,D.,Galagan,J.E.,乔治,M.,丘奇,总经理,Ramoni,M.F.,2012年。基因预测的准确性有多高?BMC基因组13,34 0。El-hariri,E.,El-Bendary,N.,Hassanien,A.E.,2014年。基于叶片特征的植物分类系统2014 年 第 9 届 IEEE 计 算 机 工 程 与 系 统 国 际 会 议 论 文 集 。 ICCES2014https://doi.org/10.1109/ICCES.2014.7030971。Enattah,N.,Pekkarinen,T.,Välimäki,M.J.,Löyttyniemi,E.,耶尔韦莱岛2005年遗传学定义的成人型乳糖缺乏症和自我报告的乳糖不耐受是芬兰绝经后妇女骨质疏松症的危险因素EUR.临床营养学杂志59,1105-1111。Giselsson,T. M.,Midtiby,H.S.,Jørgensen,R.N.,2013年。基于距离变换的形状特征的苗木识别。传感器13,5585-5602。Guzzetta,G.,Jurman,G.,Furlanello,C.,2010年。从基因型数据进行定量表型预测的机器学习管道。BMC Bioinforma.11(补编第11号)8)、S3.Hastie,T.,Tibshirani河,Friedman,J.,2001年统计学习的要素。斯普林格,纽约。Hemming,J.,Rath,T.,2001. 基于计算机视觉的田间杂草识别技术研究J. Agric. Eng. Res.78(3),233-24 3.霍普A.C.A. 1968. 一种简化的蒙特卡罗显著性检验方法。罗伊Stat. Soc.B. 30,582-59 8.Kell,D.B.,达比,R. M.,Draper,J.,2001年基因组计算。利用机器学习对植物表达谱数据进行解释性分析。Plant Physiol.126,943-95 1.Kudaravalli,S.,Veyrieras,J.B.,陌生人,B.E.,Dermitzakis,E.T.,Pritchard,J.K.,2009年基因表达水平是人类基因组中最近自然选择的目标。 摩尔生物进化26(3),649-658。Kuhn,M.,Wing,J.,Weston,S.,Williams,A.,Keefer,C.,Engelhardt,A.,库珀,T.,Mayer,Z.,Kenkel,B.,R核心团队,Benesty,M.,莱斯卡博河Ziem,A.,斯克鲁卡湖唐,Y.,坎丹角,亨特,T.,2017. 插入符号:分类和回归训练(R包版本6.0-78)。Lippert,C.,萨巴蒂尼河Maher,M.C.,Kang,E.Y.,李,S.,Arikan,O.,Harley,A.,Bernal,A.,Garst,P.,Lavrenko,V. Yocum,K.,Wong,T.,Zhu,M.,杨文是的,Chang,C.,Lu,T.,Lee,C.W.H.,希克斯,B.,Ramakrishnan,S.,Tang,H.,Xie,C.,Piper,J.,Brewerton,S.,Turpaz,Y.,Telenti,A.,罗比,R.K.,哦,F.J.,文特尔,J.C.,2017年。通过使用全基因组测序数据的性状预测来识别个体。PNAS 114(38),10166-1017 1.McCullagh,P.,Nelder,J.,1989. 广义线性模型 查普曼&大厅。米切尔,T. M.,2010年。生成分类器和判别分类器:朴素贝叶斯和逻辑重构格雷辛。https://www.cs.cmu.edu/~tom/mlbook/NBayesLogReg.pdf网站。Ng,A.Y. ,Jordan,M. I. ,2001年。 我写了一本书。一般性分类器:逻辑回归和朴素贝叶斯的组合。高级神经信息过程系统14,605-610。R 核 心团 队 ,2017 年 。R: 一 种统计计算的语 言和 环 境。 R Foundation forStatisticalComputing,Vienna,Austria(URL).Sambo,F.,Trifoglio,E.,Di Camillo,B.,Toffolo,G.M.,科贝利角,2012年。 朴素贝叶斯袋:从全基因组SNP数据中选择生物标志物和分类。BMC Bioinforma.13(补编第14号),S2。Siravenha,A.C.Q.,Carvalho,S.R.,2015年。 探讨叶型频率在植物分类上的应用。2015年第28届SIBGRAPI图形,图案和图像会议,萨尔瓦多,pp。 297- 304Tishkoff,S.A.,弗洛伊德,A.R.,阿莱西亚河,博伊特,BF巴布里恩,C.C.,西尔弗曼,J.S.,Powell,K.,莫滕森,H.M.,Hirbo,J.B.,Osman,M.,易卜拉欣,M.,Omar,S.A.,Lema,G.,Nyambo,T.B.,Ghori,J.,Bumpstead,S.,Pritchard,J.K.,雷,GA,Deloukas,P.,2007年非洲和欧洲人类乳糖酶持久性的趋同适应。Nat. Genet. 39(1),31-40.泽威湖2003. 用右脑理解敏感性和特异性。BMJ 327(7417),716-719。王,B.,Zhu,Y.,中国科学院,Zhu,J.,刘志,刘洪,Dong,X.,(中国科学院,中国地质研究所,北京,2003)郭杰,李伟,陈杰,高氏C.,郑,X.,E,L,赖,J.,赵,H.,宋,W.,2018. 在一个重新测序的大型重组自交系群体中鉴定和定位一个主要的玉米叶宽QTL。前面植物科学九,一百零一。Webb,A.,2002年。 统计模式识别第2版威利,纽约。北卡罗来纳州雷,杨杰,戈达德,医学博士,Visscher,P.M.,2010年。基因组筛选中ROC曲线下面积的遗传学解释。PLoS基因组 6(2),e1000864。Wu,S.G.,Sheng,B.F.,你X. E王玉仙Chang,Y.F.,Xiang,Q.L.,2007年基于概率神经网络的植 物 叶 片 识 别 算 法 。 IEEE InternationalSymposium on Signal Processing andInformation Technology,pp. 11比16赵,J,Bodner,G.,Rewald,B.,2016. 表型:使用机器学习改进基于根性状的成对基因型分类。前面植物科学 1864年7月7日
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功