没有合适的资源?快使用搜索试试~ 我知道了~
⃝可在www.sciencedirect.com上在线获取ScienceDirectICTExpress 7(2021)432www.elsevier.com/locate/icte糖尿病预测的机器学习算法比较放大图片作者:Simon Y. Foo电气和计算机工程系,FAMU-FSU工程学院,塔拉哈西,佛罗里达州32310,美国接收日期:2020年8月20日;接收日期:2021年1月2日;接受日期:2021年2月11日在线预订2021年摘要糖尿病是一种无法根治的疾病,因此需要早期发现。数据挖掘、机器学习(ML)算法和神经网络(NN)方法在我们的研究中用于糖尿病预测。我们使用Pima Indian Diabetes(PID)数据集进行研究,该数据集从UCI机器学习库收集。该数据集包含有关768名患者及其相应的9个独特属性的信息。我们在数据集上使用了七种ML算法来预测糖尿病。我们发现,Logistic回归(LR)和支持向量机(SVM)的模型对糖尿病的预测效果很好。我们用不同的隐藏层构建NN模型, 不同时期和观察的NN与两个隐藏层提供了88.6%的准确性。c2021韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:机器学习;数据挖掘;神经网络; K折交叉验证;准确性1. 介绍据世界卫生组织(WHO)报告,每年约有160万人死于糖尿病[1]。糖尿病是一种当人体中的血糖/血糖水平非常高时发生的疾病。根据健康专家的说法,糖尿病发生时,人体当我们吃食物时,经过消化过程,葡萄糖会被释放出来。胰岛素是一种血液激素,它从血液转移到细胞,并指示细胞消耗血糖并将其转化为能量。当胰腺不能产生足够的胰岛素时,细胞不能吸收葡萄糖,葡萄糖留在血液中。因此,血液中的血糖/血糖以非常不可接受的水平增加[3]。由于高血糖,人体会出现一些症状,如极度饥饿,强烈口渴和频繁排尿。人体内葡萄糖水平的通常范围是70至99毫克每分升。如果血糖水平超过126 mg/dl,则表明糖尿病。一个人被认为是有前驱糖尿病,如果身体葡萄糖浓度是100至125毫克/分升[4]。如果∗ 通讯作者。电子邮件地址:jk16c@my.fsu.edu(J.J. Khanam),foo@eng.famu.fsu.edu(S.Y.Foo)。同行评审由韩国通信和信息科学研究所(KICS)负责https://doi.org/10.1016/j.icte.2021.02.004人体糖尿病没有永久的治疗方法[7]。最常见的长期糖尿病会导致健康问题,即大血管和微血管并发症。大血管并发症是心脏、大脑和腿部的大血管受损。微血管并发症损害小血管,导致肾脏、眼睛、足部和神经问题[8]。如果能够早期发现,糖尿病的有效控制是可能的。保持有效的健身系统和均衡的饮食习惯有助于预防糖尿病[9]。如果患者患有前驱糖尿病,通过体育活动减轻体重可以降低患2型糖尿病的风险。疾病控制和预防中心(CDC)领导的国家糖尿病预防计划是一项改变生活方式的计划,可以帮助改变糖尿病前期患者医疗保健行业收集了大量的数据,包括医院记录,患者的医疗记录和医疗检查结果。对于早期疾病诊断,疾病的预测是通过医生的经验和知识进行分析的,但这可能是不准确的和易受影响的。因此,人工决策可能令人担忧。数据的隐藏模式可能会被忽视,这可能会影响决策;因此,患者被剥夺了适当的治疗。具有更高准确性的自动识别对于糖尿病的早期检测至关重要[112405-9595/2021韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。J.J. Khanam和S.Y. FooICT Express 7(2021)432433近年来,数据挖掘和机器学习一直是医疗领域的发展,可靠和支持工具。数据挖掘方法用于预处理和从医疗数据中选择相关特征,机器学习方法有助于自动化糖尿病预测[14]。数据挖掘和机器学习算法可以帮助使用尖端方法识别数据的隐藏模式;因此,可以做出可靠的准确决策。数据挖掘是一个涉及多种技术的过程,包括机器学习,统计和数据库系统,以从大量数据集中发现模式[15]。根据Nvidia的说法:机器学习使用各种算法从解析的数据中学习并进行预测[16]。2. 文献综述一些学者使用机器学习(ML)方法来预测糖尿病,使用 Pima Indian diabetes dataset ( PIDD ) 。 Pima IndianDiabetes数据集(PIDD)具有:9个属性,768条描述女性患者的记录。本节讨论了一些密切相关的工作[17Alam,T.M.et等人[17]通过在PIDD上应用ANN技术,显示了75.7%的准确性。Sajida Perveen等人[22]使用的数据集来自加拿大初级保健哨兵监测网络(CPCSSN)。本研究中包含的CPCSSN数据集包括与收缩压(sBP)、舒张压(DBP)、HDL、甘油三酯(TG)、BMI、空腹血糖(FBS)和性别相关的信息。他们使用了Bootstrap聚合、Adaptive Boosting和决策树模型。他们发现,为了提高准确性,Adaboost可以用于预测糖尿病、冠心病和高血压等疾病。Sisodia等人。[18]发现,在PIDD上应用的机器学习方法SVM,NB和DT中,NB分类器显示出更好的准确率,为76.30%。Tigga等人在[19]中,应用逻辑回归对PIDD进行糖尿病预测。他们发现怀孕次数、BMI和血糖水平是PIDD所有特征中预测糖尿病的最重要变量。PimaIndian Diabetes数据集用于分析,RStudio用于处理和可视化结果。他们的模型显示出相当好的预测,准确率为75.32%。在Amour Diwani et al.的研究[20],所有患者的数据都使用朴素贝叶斯和决策树进行了10次交叉验证。然后,使用WEKA的性能进行了评估,调查,并与其他分类算法进行了比较。结果表明,最好的算法是朴素贝叶斯,准确率为76.3021%。在Zou et al.在[21]的研究中,他们采用随机森林、决策树、人工神经网络对PIDD进行分类算法,然后使用最小冗余最大相关(mRMR)和最小冗余分量分析(PCA)方法进行特征约简。他们发现,皮马印第安人机器学习方法中最关键的问题就是选择逻辑特征和合适的分类器。在我们的工作中,我们使用皮尔逊逻辑特征。我们的研究工作是预测患者是否患有糖尿病。在这项工作中,为了预测患者的糖尿病,使用不同的机器学习分类算法,如朴素贝叶斯(NB),SVM,线性回归(LR),Adaboost,随机森林,K最近邻(KNN),决策树(DT)和具有不同隐藏层的神经网络(NN),并在数据集上进行评估。所有的分类方法的性能的评估是用各种测量方法完成的。3. 方法3.1. 数据、功能和软件工具在我们的研究中,Pima Indian diabetes(PID)数据集是从UCI Machine Learning Repository中收集的,该数据库来自国家糖尿病、消化和肾脏疾病研究所(NIDDK)。在PID数据集中,所有患者均为女性,年龄至少为21岁。该数据集包含有关768名患者及其相应的9个独特属性的信息。表1显示了该数据集属性的描述。用于预测糖尿病的九个属性是妊娠、BMI、胰岛素水平、年龄、血压、皮肤厚度、葡萄糖、糖尿病谱系功能和结果。“outcome”属性被视为因变量或目标变量,其余八个属性被视为自变量/特征变量。糖尿病属性0表示非糖尿病,1表示糖尿病[23]。在我们的研究中,我们使用数据挖掘和机器学习算法来预测患者是否患有糖尿病,并提高了准确性。肥胖会显著增加人们患2型糖尿病的风险。表1显示768名患者的平均体重指数为32该数据集针对2型糖尿病患者,因为BMI为30或更高的人被认为是肥胖的[24]。我们使用Weka,一种开源机器学习和数据挖掘软件工具,用于糖尿病数据集的性能分析。Weka包含用于数据预处理、聚类、分类、回归、可视化和特征选择的工具[25]。神经网络是在Answyter Notebook中实现的,Python编程语言用于编码[26]。3.2. 数据预处理预处理有助于转换数据,以便构建更好的机器学习模型,提供更高的准确性。预处理执行各种功能:离群值拒绝,填充缺失值,数据归一化,特征选择以提高数据质量。在数据集中,268个样本被分类为糖尿病患者,500个样本为非糖尿病患者。3.2.1. 缺失值识别使用excel和weka工具,我们得到了数据集中的缺失值,如表2所示。我们用相应的平均值替换缺失值。J.J. Khanam和S.Y. FooICT Express 7(2021)432434- -表1PIMA数据集的属性属性描述类型平均值/均值怀孕次数数字3.85葡萄糖口服葡萄糖耐量试验中2小时的血浆葡萄糖浓度。数字120.89BP舒张压(mm Hg)。数字69.11三头肌皮褶厚度(mm)。数字20.54胰岛素2小时血清胰岛素(µ IU/mL)。数字79.80BMI体重指数(kg/m2)。数字32DPF糖尿病谱系功能。数字0.47年龄(岁)。数字33结果糖尿病诊断结果(tested_positive:1,tested_negative:0)名义上图1.一、异 常 值和极值计数。3.2.2. 异常值识别和删除使用Weka工具,我们过滤了数据集,以基于四分位数范围检测离群值和极值。异常值和极值的数量如图所示。1,我们可以看到有45个异常值和26个极值。从数据集中去除这些异常值和极值后,有699个实例。3.2.3. 特征选择Pearson该方法通过计算相关系数,将输出属性与输入属性进行相关。系数值保持在1和1之间的范围内。0.5以上及以下的值0.5表示显著相关,零值表示无相关。在Weka中,相关滤波器用于查找相关系数,结果如表3所示。我们使用0.2表4归一化后的平均值和标准差属性是说标准偏差Preg0.230.20葡萄糖0.480.19胰岛素0.500.18BMI0.350.17年龄0.200.19作为相关属性的截止值。因此,SkinThickness、BP、DPF特征被移除。葡萄糖、BMI、胰岛素、妊娠和年龄是我们最相关的五个输入属性。3.2.4. 正常化我们通过将数据从0到1范围归一化来进行特征缩放,这提高了算法归一化后所有属性的平均值和标准差结果见表4。在图2中,我们可以看到,在完成预处理后,我们有699个样本/实例,其中466名患者没有糖尿病,233名患者患有糖尿病。预处理后,输入和输出属性之间的相关性如图3所示。在图3中,我们可以看到“葡萄糖”和“结果”的相关系数为0.46。因此,这些是高度相关的。3.3. 数据集训练和测试方法在数据清理和预处理之后,数据集就可以进行训练和测试了。我们分别使用K-fold交叉验证和85%训练/测试分裂方法来测试不同机器学习模型在火车上表2PIMA数据集中缺失值的数量表3输入和输出属性之间的相关性属性缺失值属性相关系数Preg0葡萄糖0.484葡萄糖5BMI0.316BP35胰岛素0.261皮肤厚度227Preg0.226胰岛素374年龄0.224BMI11皮肤厚度0.193DPF0BP0.183年龄0DPF0.178J.J. Khanam和S.Y. FooICT Express 7(2021)432435=表5DT、KNN、RF、NB、AB、LR、SVM分类器的混淆矩阵试验方法LRKNNSVMNBDTRFAB0101010 1010101k折交叉验证0 409570 38779 041452 0386 800 382840 391750 401650 1051281 95138 1110123 191 1421 961371 1001331 1171160101010 1010101列车/试验拆分0 101180 9722 010118 098 210 94250 96230 102171 19371 1442 12135 117 391 22341 17391 1937图二. 预处理后糖尿病患者和非糖尿病患者的人数。见图4。 建议的模型图。图3.第三章。预 处理后输入输出属性之间的相关性。方法,我们将数据集随机分为训练集和测试集。在K交叉验证方法中,数据被分成K个折叠。一个折叠用于验证/测试,剩余的K-1折叠用于训练。该过程将继续,直到每个单个K折叠都是测试集。通过Kth测试的所有记录分数的平均值来衡量性能。3.4. 分类模型在这项研究工作中,全面研究了PIDD应用不同的ML分类技术,如DT,KNN,RF,NB,AB,LR,SVM和神经网络(NN)。我们将第K个值7用于KNN算法。拟议的模型图如图所示。 四、3.5. 神经网络模型实现我们建立了三个不同的神经网络模型,具有不同的隐藏层。我们实现了具有不同时期(200,400,800),并对结果进行比较。在ANN中,输入的加权和由隐含层中的激活函数处理。我们在工作中使用了两种类型的 激 活函 数 , sigmoid 和 sigmoid U 。 我 们使 用 Keras 和Tensor-Flow库来创建神经网络模型。我们使用Keras库中的Sequential类。目标变量是“Outcome”属性。在人工神经网络中,需要优化器来减小反向传播方法的输出误差。我们使用SGD(随机梯度下降)作为优化器。学习率是优化算法中的参数,其控制关于损失梯度的权重调整。我们使用不同的学习率来找到一个有效的学习率。在scikit-learn库中,我们使用了train test split函数来执行train/test拆分任务。我们使用scikit learn库中的cross val score函数进行K折交叉验证任务。由于目标变量是二进制的,在我们的工作中使用的3.5.1. 一种单隐层神经网络模型的建立首先,我们建立了一个具有一个隐藏层的神经网络,除了输入和输出层之外。我们定义输入层有五个神经元,因为有五个特征。隐藏层有五个神经元和一个激活函数。输出层有一个神经元和一个sigmoid激活函数。具有一个隐藏层的NN的模型总结在下面的图中给出。 五、3.5.2. 开发具有两个隐藏层的神经网络在这里,我们定义了一个具有四个密集层的NN模型。第一层和第四层分别是输入层和输出层,具有相同的输入形状、神经元和激活J.J. Khanam和S.Y. FooICT Express 7(2021)432436==−====-图五、 单隐层神经网络模型。图六、双 隐层神经网络模型函数为具有一个隐藏层的NN。第二层由具有26个神经元的隐藏层组成,第三层由具有5个神经元的隐藏层组成。每个隐藏层的神经元的激活函数是CIU。具有两个隐藏层的NN的模型总结在下面的图中给出。 六、图7.第一次会议。三 层隐层神经网络模型表6K折交叉验证和Train/Test分裂方法的所有分类方法的性能度量。3.5.3. 一种具有三个隐含层的神经网络模型的开发在这里,我们开发了一个具有五个致密层的模型。第一层和第五层分别是输入层和输出层,具有与具有一个隐藏层的NN相同的输入形状、神经元和激活函数。第二、第三和第四隐藏层分别有16、10、5个神经元。每一隐层神经元的激活函数为α U。具有三个隐藏层的NN的模型总结在下面的图中给出。7 .第一次会议。4. 结果和讨论召回(TP)(TP+FN)精密度(TP)(TP+FP)F测量2×(精确度×召回率)(精确度+召回率)(二)(三)(四)4.1. ML方法DT、KNN、RF、NB、AB、LR、SVM的结果机器学习算法的准确度可以从混淆矩阵中计算出来。在抽象术语中,混淆矩阵如下所示。预测否(0)预测是(1)实际否(0)TN FP是(1)FN TP这里,FP假阳性、FN假阴性、TN真阴性和TP真阳性。等式(1)DT、KNN、RF、NB、AB、LR、用于交叉验证的SVM分类器和训练/测试分割的混淆矩阵如表5所示。PIDD上使用的所有分类算法的性能测量值如表6所示。在表6中,我们可以看到所有分类方法的准确率都在70%以上。此外,LR和SVM这两种方法都显示出更好的准确性,这两种测试方法。所有分类器的性能基于K折交叉验证和训练/测试分裂方法的不同测量,通过图1和图2中的图表绘制。第8和第9条。4.2. 神经网络分类精度召回F-measure精度DT(K倍)0.7390.7420.74174.24%DT(拆分)0.7350.7310.73373.14%RF(K倍)0.7440.7500.74674.96%RF(分离)0.7790.7710.77477.14%NB(K倍)0.7530.7550.75475.53%NB(拆分)0.7870.7830.78578.28%LR(K倍)0.7610.7680.76176.82%LR(拆分)0.7880.7890.788百分之七十八点八五KNN(K倍)0.7470.7510.74975.10%KNN(分裂)0.8040.7940.79879.42%AB(K倍)0.7300.7400.73073.96%AB(拆分)0.7920.7940.79379.42%支持向量机(K-fold)0.7610.7680.75976.82%J.J. Khanam和S.Y. FooICT Express 7(2021)432437=在具有隐藏层1的NN中,具有200个时期,我们将学习率改变为0.1,0.01,0.005,如Ta所示。准确度(TP+ TN)(TP+TN+ FN+ FP)(一)表7.我们发现,学习率为0.01提供了更好的准确性。因此,在每种情况下,我们使用学习率= 0.01。J.J. Khanam和S.Y. FooICT Express 7(2021)432438图8.第八条。 所有分类器的性能的图形表示与10倍交叉验证方法。图9.第九条。 使用训练/测试分裂方法的分类器性能的图形表示。表8显示了在学习率为0.01时,epoch在具有隐藏层1、2和3的神经网络中的影响。我们发现,具有两个隐藏层的NN模型在0.01的学习率下具有400个epoch,提供了88.6%的最佳准确率。在所有的神经网络模型中,神经网络模型具有更高的精度、训练精度和测试精度.我们最好的模型NN的神经网络,包括两个隐藏层,如图所示。10个。2个隐藏层400个历元的ROC曲线(受试者工作特征曲线)如图所示。十一岁在K= 10倍交叉验证的情况下,我们还计算了200个时期的两个隐藏层NN模型的精度。平均准确率为76%。J.J. Khanam和S.Y. FooICT Express 7(2021)432439表7学习率对准确性测量的影响学习率精度0.10.8290.010.8380.0050.800表8在学习率为0.01时,隐层的变化对精度有影响隐藏层历元精度训练精度测试精度12000.83876.43%83.81%4000.84877.27%84.76%8000.82979.46%82.86%22000.87676.77%87.62%4000.88678.96%88.57%8000.85781.65%87.62%32000.82976.77%82.86%4000.838百分之八十三83.81%8000.79087.04%79.05%图10个。双 隐层神经网络模型图十一岁 具有400个时期的2个隐藏层NN的ROC曲线。结论糖尿病的早期检测是医疗保健行业的重大挑战之一。在我们的研究中,我们设计了一个系统,它可以预测糖尿病的高准确性。我们使用WEKA工具对数据进行了预处理。使用特征缩减方法,我们去掉了三个特征。我们在PIMA数据集中使用了五个输入特征(血糖、BMI、胰岛素、妊娠和年龄)和一个输出特征(结果)。我们在PIDD上使用了七种不同的机器学习算法,包括DT,KNN,RF,NB,AB,LR,SVM来预测糖尿病,并评估了各种措施的性能。所有模型在准确率、精确率、召回率和F-测度等参数上都表现出良好的效果。所有模型的准确度均大于70%。LR和SVM的训练/测试分割和K折交叉验证方法提供了约77%-78%的准确度。我们还实现了用于糖尿病PIDD预测的NN模型。 我们在神经网络模型中使用了1,2,3个隐藏层,改变了epoch 200,400,800。隐藏层2与400 epoch提供了88.6%的准确性,这是最高的准确性在我们实现的模型PIDD。 在所有提出的模型中,具有两个隐藏层的NN被认为是分析糖尿病的最有效和最有前途的模型,对于所有不同的时期(200,400,800),准确率约为86%。logistic回归(78.8571%)、Naive Bayes( 78.2857% ) 、 随 机 森 林 ( 77.3429% ) 和 ANN( 88.57 ) % 的 准 确 度 优 于 Tigga 等 人 [19] ( LR =75.32% ) 、 Sisodia 等 人 [18]( NB = 76.30% ) 、 AmourDiwani等人[19 ](LR = 75.32%)和ANN(88.57%)研究的准确度。等[20](NB = 76.3021%)、Zou等[21](RF =77.21%)和Alam,T.M.et等[17](ANN =75.7%)。CRediT作者贡献声明Jobeda Jamal Khanam:概念化,方法论,软件,数据管理,写作-原始草稿,可视化。西蒙·Y Foo:方法论,监督,调查,软件,资源,验证,写作-评论&编辑,资金获取.竞合利益作者声明,他们没有已知的可能影响本文所报告工作确认这项工作的部分资金由佛罗里达A M大学和佛罗里达州立大学,美国。引用[1] 我的朋友们://我的朋友们:/我的朋友们:/ WHO。在这里,你可以找到一个很好的选择。[2] 我的朋友们://我的朋友们:/我的朋友们:/ 我每天都要吃新的。C0M/ARTiCLES/325018#HW-是-该电子-pancreas-linked-with-diabetes。[3] 我的朋友们://我的朋友们:/我的朋友们:/ 我的天com/diabetes/diabetes-caus。[4] 我的朋友们://我的朋友们:/我的朋友们:/ 我是一个年轻人。Org/Diseas-conditions/prdiabetes/Diagnosis-treatment/drc-2035284.J.J. Khanam和S.Y. FooICT Express 7(2021)432440[5] 我的朋友们://我的朋友们:/我的朋友们:/ niddk. 尼海gov/healthinforormartion/diabetetes/overververview/symptoms-casess.[6] 我的朋友们://我的朋友们:/我的朋友们:/ 我的天啊。co。uk/diabetes_care/blood-sugar-level-ranges。HTML.[7] 我的朋友们://我的朋友们:/我的朋友们:/ 他是个大人物。com/right-care/diabetes/is-there-a-cure-for-diabetes。[8] 我的朋友们://我的朋友们:/我的朋友们:/ 我是说,我是说,我是说。VIC. gov. au/health/conditit ins和treatments/diabetes-long-term-efects。[9] S.A. Kaveeshwar,J. Cornwall,糖尿病的现状在印度澳大利亚Med. J. 7(1)(2014)45。[10] 我的朋友们://我的朋友们:/我的朋友们:/ cdc.gov/diabetes/basics/prediabetes. HTML.[11] C.L. Huang,M.C.陈春杰,王建,基于支持向量机的信用评分数据挖 掘 方 法 , 专 家 系 统 应 用 , 33 ( 4 ) ( 2007 )847http://dx.doi.org/10.1016/j.eswa.2006.07.007[12] J. Chaki,S. Thillai Ganesh,S.K. Cidham,S. Ananda Theertan,基于机器学习和人工智能的糖尿病检测和自我管理:系统综述,J.King SaudUniv. - 计算机INF. Sci. (2020年)。[13] I. Contreras,J. Vehi,糖尿病管理和决策支持的人工智能:文献综述,J. Med. Internet Res. 20(5)(2018)e10775。[14] G. 斯 瓦 普 纳 河 Vinayakumar , K.P. Soman , Soman KP diabetesdetection using deep learning algorithms , ICT Express 4 ( 4 )(2018)243http://dx.doi.org/10.1016/j.icte.2018.10.005[15] M.W.克雷文,J.W. Shavlik,使用神经网络进行数据挖掘,FutureGener。Comput. 13(2 http://dx.doi。org/10.1016/s0167-739x(97)00022-8。[16] https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/.[17] T.M.Alam等人,医学信息学开启了糖尿病早期预测模型,Inform。Med.已解锁16(2019)100204。[18] D. Sisodia,D.S. Sisodia,使用分类算法预测糖尿病,ProcediaComput。Sci. 132(2018)1578[19] N.P. Tigga , S. Garg , Predicting type 2 Diabetes using LogisticRegressions- sion accepted to publish in:Lecture Notes of ElectricalEngineering,Springer.[20] Salim Amour Diwani,Anael Sam,使用监督学习技术进行糖尿病预测,Adv. Comput。科学:中间体J [S.l.] (ISSN:2322-5157)(2014)10http://www.acsij.org/acsij/[21] Q. Zou ,K. Qu ,Y. Luo ,L. Yin ,Y. 朱, H. Tang ,PredictingDiabetes Mellitus with Machine Learning Techniques , Vol. 9 ,Frontiersingenetics,2018,p.515,http://dx.doi.org/10.3389/fgene.2018.00515。[22] S. Perveen,M. Shahbaz,A.古尔加奇湾Keshavjee,数据挖掘分类技术预测糖尿病的性能分析,ProcediaComput。Sci. 82(2016)115[23] M. Lichman,Pima Indians糖尿病数据库,编辑。机器学习和智能系统中心。UCI机器学习仓库。[24] https://www.cdc.gov/obesity/adult/defining.html网站。[25] S.R. Garner , Weka : The Waikato environment for knowledgeanalysis , in : Proceedings of the New Zealand Computer ScienceResearchStudentsConference,Citeseer,1995,pp. 57比64[26] https://en.wikipedia.org/wiki/Project_Jupyter网站。[27] H. Benhar,A. Idri,J. Fernán-Alemán,医学信息学决策的数据预处理:潜力和分析,在:世界信息系统和技术会议,2018年,第10页。1208-1218
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功