深度学习与机器学习在精神障碍多标签分类中的性能比较与影响因素分析

71 浏览量更新于2024-01-09 收藏 1.36MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

医学信息学解锁23（2021）100545深度和机器学习技术在精神障碍疾病多标签分类性能中放大图片作者：Stephen G. Fashoto b，*，Bunmi Fashoto c，Elliot Mbunge b，Sakinat O. Folorunso d，耶利米奥拉米朱旺a美国德克萨斯州阿灵顿的德克萨斯大学计算机科学与工程系b斯威士兰夸卢塞尼的斯威士兰大学计算机科学系c斯威士兰基督教大学心理学系，Mbabane，斯威士兰d尼日利亚奥贡州Ago-Iwoye Olabisi Onabanjo大学数学科学系eEBlocks Software，138 West Street，Sandton，Johannesburg，南非A R T I C L EI N FO保留字：深度神经网络深度学习类不平衡精神障碍多标签分类A B S T R A C T电子健康记录（EHR）包含许多不同疾病的症状，因此必须建立模型来早期识别这些问题并对疾病进行适当分类。该分类任务可以被呈现为单标签或多标签问题。因此，本研究将精神障碍疾病（PDD）数据集与五个标签：双相情感障碍，血管性痴呆，注意力缺陷/多动障碍（ADHD），失眠和精神分裂症作为一个多标签分类问题。该研究还调查了深度神经网络和机器学习技术的使用，如多层感知器（MLP），支持向量机（SVM），随机森林（RF）和决策树（DT），用于识别患者数据中的隐藏模式该研究进一步研究了与某些类型的精神病相关的症状，并从多标签分类的角度解决了类别不平衡问题。这些模型的性能进行了评估和比较的基础上的准确性度量。结果显示，深度神经网络在类别不平衡准确度方面表现出色，达到75.17%，而MLP模型的准确度为58.44%。相反，机器学习技术中表现最好的是随机森林模型，使用没有类不平衡的数据集，与深度学习技术相比，其结果分别为64.1%和55.87%。研究还发现，患者的年龄是对模型性能贡献最大的特征，而离婚是最小的。同样，研究表明，双相情感障碍患者失眠的倾向很高;这些疾病与R值0.98密切相关。我们的结论表明，将深度和机器学习模型应用于PDD数据集不仅可以改进疾病的临床分类，还可以通过消除类别不平衡和解开影响患者PDD的属性来增强临床决策系统。1. 介绍在过去，精神障碍疾病（PDD）依赖于传统的方法，这些方法是根据专家意见构建的，并在国际疾病分类（ICD）-11、精神障碍诊断和统计手册（DSM）-5和国家精神卫生研究所的研究领域标准（RDoC）中得到体现，目前，在传统方法的地方已经探索了统计学、机器学习、自然语言处理技术和神经影像学来早期检测PDD [3，4]，但由于可能夸大现有文献的潜在方法学问题，结果的可靠性尚不清楚。除此之外，目前，现有文献中存在两个主要局限性，限制了研究结果在现实世界临床实践中的转化适用性[5]。基于机器学习的诊断工具用于检测患有确定的精神障碍疾病的患者的适用性对于临床实用性来说是最小的[5]，这与现实世界的临床实践形成对比，因为检测疾病* 通讯作者。电子邮件地址：gbengafash2@gmail.com，sgfashoto@uniswa.sz（S.G.Fashoto）。https://doi.org/10.1016/j.imu.2021.100545接收日期：2020年6月21日;接收日期：2021年2月28日;接受日期：2021年2021年3月17日网上发售2352-9148/©2021的作者。发表通过 Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页：http://www.elsevier.com/locate/imuI. Elujide等人医学信息学解锁23（2021）1005452| ||为|=在疾病的早期阶段，可能无法预测，有时治疗尚未决定。诊断PDD患者对医生、心理学家和精神科医生来说是唯一的临床压力[6]，因为他们需要了解患者的病史和精神病史。PDD与非传染性慢性病（NCD）共存[7]。精神障碍疾病（如精神分裂症）的诊断基于DSM-5和ICD，并且在临床上进行，因为可以准确预测疾病的特定生物标志物仍然未知[8]。新兴技术，如机器学习方法（如模式识别，支持向量机，多变量模式分析，高斯过程，逻辑回归，随机森林，神经网络）[4，9]和磁共振成像（MRI）[8，10]，当应用于神经图像数据时，代表了一种新的有前途的方法，可以支持精神疾病的诊断。PDD的问题仍然存在，它是全球最具破坏性的精神疾病之一[2，4]，因为它使个人在心理上丧失能力。目前还没有已知的治疗精神疾病的方法，但及时发现和及时干预可以帮助减缓疾病[2，4，11]。精神疾病的发作主要是在非严重症状之前，这是诊断精神疾病或精神病早期发作的主要挑战。DSM-5和ICD-10系统要求在诊断精神病性障碍之前排除医疗条件[12 ]第10段。为了克服PDD的破坏性状态，精神病社区的精神病学家和心理学家与计算机科学家和工程师合作，同时基于现有数据集开发用于预测精神障碍疾病的机器学习算法[3，13，14]。论文的大纲如下：第2节描述了本研究中讨论的精神障碍类型-用于多标签分类的深度和机器学习技术，深度学习方法和机器学习技术中的类不平衡。第三节介绍了本研究采用的方法。将描述所使用的PDD数据集，并且还将其表示为多标签问题。此外，深度学习架构和用于多分类和类不平衡的机器学习技术将被广泛描述。第4节将根据研究中使用的测量方法讨论获得的结果。最后，第5节将总结工作并描述未来的工作。2. 精神障碍2.1. 精神障碍根据尼日利亚现有的数据集，本研究考虑了五种类型的精神障碍，以标记精神病患者;这些包括双相情感障碍、注意缺陷多动障碍、精神分裂症、血管性痴呆和失眠症。2.1.1. 双相情感障碍双相情感障碍是一种不寻常的情绪变化，通常是极端的和波动的，并在不规则的时间间隔发生。情绪介于愉快的感觉和抑郁症之间[15]。双相情感障碍分为双相I型和双相II型。双相I型的诊断症状包括躁狂发作至轻躁狂发作，而双相II型的诊断症状范围从轻度抑郁至中度和重度抑郁发作[16]。2.1.2. 注意缺陷多动障碍如今，在精神病学领域，轻微脑功能障碍（MBD）的新名称是注意缺陷多动障碍（ADHD）。注意力缺陷的特征是无法维持和/或保持注意力，控制冲动和调节身体活动的水平[17]，而多动症被描述为高度冲动的儿童，行动太快而不思考完成任务，并拒绝等待轮到他们[18]。儿童（尤其是3至6岁）、青少年和成人使他们能够感知环境中的大多数刺激并做出反应，这使他们容易发生事故或受伤、睡眠障碍、攻击性、情绪波动、药物滥用、语言不成熟、焦虑状态、学业成绩不佳和不受同龄人欢迎[19]。由于ADHD症状因人而异，诊断需要时间，在某些情况下，由于不同的临床检查，导致错误率很高由于ADHD症状因人而异，ADHD在不同的人中可以以三种不同的方式出现：注意力不集中，多动冲动，以及两者的组合[20]。2.1.3. 精神分裂精神分裂症的特征是一系列症状，如精神功能恶化、语言障碍、言语不连贯、社交退缩、幻觉、运动障碍和非理性思维[6]。精神分裂症是一种影响个人心理功能的各个领域成年人群中精神分裂症的患病率在0.3%至0.7%之间，但男性高于女性成年人[21]。2.1.4. 血管性痴呆血管性痴呆（VD）是一种神经认知障碍，其特征在于记忆和认知功能的进行性认知下降。也就是说，这些人的语言，复杂注意力，学习和记忆，社会认知和运动功能下降[12]。患有痴呆症的人可能会自杀，抑郁，对自己和他人有害[12]。老年人（65岁以上）的患病率很高，在成年人口中的患病率在2%至25%之间。世界卫生组织估计，3560万人患有痴呆症，预计到2050年这一数字将增加两倍，因为每年诊断出770万例新的痴呆症病例，给社会带来经济负担[22]。2.1.5. 失眠失眠也被称为睡眠障碍，是一种慢性睡眠障碍。患有失眠症的人会经历入睡的挑战，并且无法保持睡眠[23]。这种精神状况可能是间歇性的，从急性（几周）到慢性（几个月）。2.2. 用于PDD几种模型已被应用于解决单标记分类和多类问题。单标签分类需要从一组与单个标签相关的实例中学习从一组不相交的标签L中， L >1. 如果 L2，则称之为二进制分类问题多类问题的特征在于：|> 2.| > 2.然而，多标签分类的特征在于与一组标签YL相关联的实例[24]。例如，作者在Ref。 [25日] 提出一种无监督深特征学习方法命名为“深度患者”，具有3层的去噪自动编码器堆栈，以捕获聚合EHR中的层次结构和依赖关系。这些EHR包含约700，000名患者作为样本，其中78种疾病作为来自西奈山数据仓库的标签，其被分成89.11-10.89的训练-测试分割比率。结果显示，严重的糖尿病、精神分裂症和各种癌症表现最好。参考文献[ 4 ]采用的方法是语义和潜在内容分析。它考虑了语义密度，这是由句子中使句子有意义的部分的数量决定的。此外，它将个人的语音与其他人的语音模式的大型数据库进行比较，以确定语音何时变得异常。这导致了对个体中可能的精神病的预测。然后用这两个语言指标实现两层神经网络形式的机器学习技术，I. Elujide等人医学信息学解锁23（2021）1005453∑i=1预测精神病参考文献[3]中的作者提出了在PDD上使用机器学习评估，如标签和基于排名的观点。在研究中考虑的评估指标是汉明损失（HL），一个错误（OE），零一损失（ZOL），排名损失（RL），准确性（Acc），平均精度（AP），微观F1和宏观F1。研究的数据集在支持向量机（SVM）、朴素贝叶斯（NB）、逻辑模型树（LMT）和朴素贝叶斯树（NBTree）、问题转换（PT）和枚举方法中的基础分类器上进行了评估。PT方法使用二进制相关性（BR）、分类器链（CC）、概率分类器链（PCC）、修剪集（PS）、FW和RT，而集成方法使用随机k标记集（RAkEL），RAkELd，感知器（MLP）[33]。在多层前馈网络中，每个输入变量与输入层中输入的权重值相关联。输入层中的每个节点由人工神经元组成其对输入变量（x1，x2，...，xn）和相关联的权重值（w1，w2nY i=（1 ）第一次见面i=1然后传递加权输入的求和输出EBR，分类器链（ECC），EFW，EPCC，通过非线性激活函数f（∑n xiwi）o变换剪枝集（EPS）、ELC和ERT。研究表明，在多标签分类方法中，使用朴素贝叶斯（NB）和朴素贝叶斯树（NBTree）的标签幂集（LP）和剪枝集（PS）在PDD数据集上的评估措施方面始终表现最好参考文献[26]通过利用人工智能和知识库的混合物来检查精神分裂症诊断，知识库提供专家系统以进行准确的诊断。用于对精神障碍进行分类的知识库来源于先前建立的多标准决策分析的工作和模型，而人工智能则用于创建产生式规则和概率。参考文献[6]中的工作回顾了35项先前的研究，这些研究利用不同机器学习技术的各种组合，例如支持向量机，多变量模式分析和随机森林，以分析神经图像并确定特定受试者中是否存在精神分裂症。会议审议了人工智能和机器学习在医学和精神病学中的应用在参考文献[27]中。这项研究着眼于使用这些技术的可能未来在这些行业中，特别是，好处和挑战。2.2.1. 深度学习方法精神障碍病例的增加和深度学习算法的普及为深度学习算法的应用提供了前所未有的机会，用于使用患者数据对PDD进行建模和分类深度学习（DL）方法在许多领域取得了显著的成果，从而通过数据集中的深度层次特征构建彻底改变了机器学习领域。DL是机器学习的一个子集，由多层神经网络组成;一个或多个隐藏层相互连接，形成一个网络，能够学习具有高抽象级别的复杂结构[28]。卷积神经网络（CNN）、递归神经网络（RNN）、深度强化学习（DRL）和多层前馈网络等深度学习方法可以通过连续的非线性变换从原始数据中学习最佳表示，从而实现与机器学习算法相比越来越高的抽象水平和复杂性[5]。DL神经网络受到人类大脑处理信息的方式的启发[29]，因此，其架构由一个输入层，两个或多个隐藏层和一个输出层组成。PDD数据被输入到输入层，PDD数据的抽象特征被传递到隐藏层，隐藏层使用激活函数对它们进行处理。然后将特征或模式馈送到输出层，输出层将观察值分配给类。通过迭代调整隐层神经元之间的互连关系（权值和学习率）来提高DL算法的性能。2.2.1.1. 多层前馈网络。包括[5，30]在内的几位学者将多层前馈网络应用于精神疾病的分类和建模。多层前馈网络是以分层结构组织的前馈神经网络，其中信息在一个方向上从一层传播到另一层，从输入层传播到输出层，而没有反馈回路[31，32]。多层前馈网络也称为多层前馈网络。将神经元的预激活水平转换为输出yi，如图1所示。权重值决定每个神经元输入的强度和方向（抑制或兴奋）。输入层的输出然后被用作前一层的输入，称为隐藏层。隐藏层的数量表示网络的深度。隐藏层的输出被馈送到输出层，其目的是在分类的上下文中对标签进行分类。每个神经元与前一层中的所有前驱神经元以及前馈结构中的前一层中的所有神经元完全连接，如图2所示。通常，使用反向传播方法训练MLP，其中使用从输出层到输入层的关联权重值（学习率或动量值）来调整误差。这个过程称为网络训练。因此，网络训练使用训练集和训练算法迭代地继续，直到误差达到其最小值。2.2.1.2. 卷积神经网络（CNN）。最近的研究表明，卷积神经网络随后被应用于对精神疾病进行分类[34CNN是一种深度神经网络架构，最初由LeCun于1989年引入，旨在处理视觉图像[37]。CNN可以被认为是一个分类器，它提取和处理图像数据的分层特征。因此，图像作为输入标签给出，并且自动完成训练。在CNN中，第一层是输入图像。CNN不是只有输入层和输出层，而是有更多额外类型的层，称为卷积层，池化层和全连接层。卷积层是CNN的核心模块，负责将输入图像与可学习的滤波器进行卷积并提取其特征[38]。每个滤波器都由检测层输入特征的神经元组成滤波器具有宽度（Wi）、高度（Hi）和通道数（Di）的空间维度。因此，卷积意味着每个滤波器中的神经元的元素乘元素的总和因此，具有诸如填充和步幅的参数的二维特征图相应地在每层中与单个滤波器的卷积上产生步幅确定特征图的大小，并且与过滤器相关联的权重每个卷积层都有n个过滤器（其中n是过滤器的数量），每个过滤器都会产生一个特征图。卷积层的输出是由包含不同权重的滤波器产生的堆叠特征图，如图所示。3.第三章。Fig. 1. 人工神经元的结构。I. Elujide等人医学信息学解锁23（2021）1005454图二. 多层前向神经网络。池化层是在两个连续的卷积层之间定期添加的层，以减少来自前任层的冗余表示，因此，它控制过拟合[39]。根据参考文献[38]，平均池化和最大池化是卷积神经网络的典型池化操作。当池化特征非常稀疏时，最大池化更适合，而平均池化允许这些网络在每一层上作用于不同的频率，同时对图像进行下采样以增加不变性并减少冗余[40]。池化层简单地减少了位于小矩形感受野中的前一个卷积层的神经元数量完全连接层，就像MLP中的隐藏神经元一样，所有神经元都与前一层中的所有激活有完全连接。因此，所有神经元既不包含空间信息，也没有反馈回路。全连接层的主要目标是重塑和组织后续卷积层和池化层的特征向量结果。难以训练，由于众所周知的梯度消失和爆炸问题，并且难以学习长期模式[42]。2.3. 机器学习技术中的类不平衡现实问题中的数据集通常是不平衡的，这可能会导致某些类比其他类拥有更多的实例[43]。这意味着一个更感兴趣的阶级，无论是积极的还是少数的阶级，都没有得到充分的代表。这对训练分类器有显著的不利影响，例如训练阶段的收敛和分类器在测试集上的泛化[44]。因此，类不平衡在训练分类器时带来了一些困难，包括不平衡的类分布和类重叠[45]。因此，在训练分类器时，应小心处理类不平衡，特别是当数据集中存在巨大不平衡时。解决类别不平衡问题的方法之一是通过重新分配来改变类别分布[46]。该技术涉及欠采样、过采样和高级采样。在本文中，我们应用过采样方法，重点是合成少数过采样技术（SMOTE），如参考文献[47]所提出的。SMOTE已被用于许多领域，包括医学和生物信息学。它生成合成的少数民族的例子，过采样的少数民族类。SMOTE生成合成样本，而不考虑机器学习中的相邻样本[48]。为了解决不平衡的分类问题，SMOTE使用以下等式。D新=Di+rand*（Dknn-Di）i=1，2，3，其中Dnew是合成样本，Di是少数样本，Dknn是来自少数样本的k-最近邻的样本，rand是0和1之间的随机数[49]。改进的SMOTE算法实现如下。1 确定T（i-n）（目标变量）和独热编码ti（其中2.3.1.1. 递归神经网络（RNN）。递归神经网络0，1∈ti）联系我们由约翰·霍普菲尔德于1982年发现它最初是用来2 连接所有T（i - n），使得D=（1，2，通过在网络中引入循环，向前和向后遍历输入标签来发现模式[41]。递归神经网络与多层前馈网络架构的不同之处在于，至少有一个反馈连接允许来自过去输入的信息影响当前输出。这意味着神经元之间的连接形成定向循环或反馈循环，以表现出动态的时间行为，特别是在隐藏层中。与MLP不同，RNN使用内部存储器来处理输入。这是递归神经网络的一个显著特征然而，RNN是3 确定Di（特征向量）和Dknn（来自少数样本的k4 输出特征向量与少数样本的k5 将输出乘以rand（0到1之间的随机数）。6 将输出添加到特征向量Di以选择特征向量之间的线段上的新点。7 重复步骤3至6以识别新的特征向量说明。我们对所有目标变量使用独热编码（其中每个目标图三. 卷积神经网络（CNN）架构[37]。I. Elujide等人医学信息学解锁23（2021）1005455变量为binary）。然后，我们将目标变量连接到一个变量中。然后，我们应用传统的多类SMOTE算法。因此，本研究旨在确定深度学习模型在PDD的多类数据集上的分类性能，分别基于性能测量和显著性检验检查的内部和统计验证。统计技术用于产生深度学习模型可以生成的统计显著性结果本研究分析了PDD、双相情感障碍、血管性痴呆、精神分裂症、精神分裂症和注意缺陷多动障碍（ADHD）五个数据集，以分类患者的不同类型的精神病。患者可以被诊断患有一种或多种疾病。在我们以前的研究中[3]，使用Ensemble机器学习实现了一组介绍性实验，重点是多标签分类。对4种多标记分类算法、15种MLC方法和10种评价指标进行了比较在这项研究中，我们使用了深度神经网络和机器学习技术，如多层感知器（MLP），随机森林（RF），决策树（DT）和支持向量机（SVM），从类不平衡和平衡类的角度。我们比较了机器学习技术与深度学习的结果，有和没有类不平衡。3. 材料和方法3.1. 数据收集数据由Adejumo等人从尼日利亚拉各斯州亚巴的亚巴精神病医院获得[50]。它包含了500例精神病患者的病历，16个变量（11个自变量和5个因变量）。这些信息跨越了五年（2010年1月至12月）。2014年）。采用深度学习神经网络来满足机器学习算法无法解决的边缘情况。采用机器学习技术，使用合成少数过采样技术（SMOTE）消除数据集中的类别不平衡。使用one-hot-vector编码技术将来自实验的分类特征向量转换为二进制。深度学习神经网络被设计为3层深度架构，如图4所示。该架构中使用的激活函数分别用于连接层和输出层的整流线性单元（RECITEDLINEAR UNITS，简称RECITED LINEAR UNITS）和sigmoid。训练的损失函数是一个二进制交叉熵和评估指标的准确性。图4a和图4b中的第一层是输入层，其中输入数据被读入网络模型。第五层是用于分类的输出层（单标签和多标签）。第二层、第三层和第四层称为隐藏层。隐藏层是输入层和输出层之间的层。隐藏层的数量表示网络的深度3.2. 深度学习在深度学习中，参数设置是要执行的关键任务之一。深度学习和机器学习中考虑的参数是模型参数和超参数。模型参数与网络使用的内部参数有关，例如权重，神经元，而超参数处理外部参数设置，例如学习率，动量，时期，激活函数，dropout，隐藏层数量，优化器等。超参数用于确定网络的结构、功能、精度和有效性。确定微调超参数的最佳设置的常用方法是试错法、网格搜索（蛮力）、贝叶斯优化和随机搜索[6，51]。基于网格的搜索方法在这项研究中使用，由于其简单的实现。以下是本研究中使用的超参数。隐藏层：神经元的隐藏层越多，精度本研究中使用了三个隐藏层见图4。深度学习网络分类架构。I. Elujide等人医学信息学解锁23（2021）1005456（）=-1--e+FNTN+FP+FNTP+FP查全率+查准率Drop-out：这是用于防止过拟合的正则化方法的一个例子。在这项研究中，选择丢弃而不是L1和L2正则化，因为它不依赖于成本函数的修改，而是修改网络。激活函数：这些是数学方程，主要用于确定哪个函数处理输入到每个神经元的输入。激活功能也可以称为传输（续）用于深度学习训练。操作系统CPU功能在这项研究中，它被认为是帮助网络收敛体系结构：X86_64在训练中学得更快。有两种类型的激活函数，它们是线性和非线性激活函数。最常用的是非线性激活函数。常用的非线性激活函数如下。1. Sigmoid：如等式（3）中所表示的该函数的输出值在0和1之间。sigmoid函数是可微的CPU操作模式：32位，64位字节顺序：小端CPU：2型号名称：Intel（R）Xeon（R）CPU@2.30 GHz内存：13 G磁盘：73 G但它不允许输出值的跳跃，光滑。sigmoid函数也可以称为logistic函数。它们可以用于深度和机器学习中的前馈神经网络[52]。f x11+e-x（三）3.3.1. 机器学习技术机器学习技术模型在Python 3.7上运行，2. 双曲正切：如等式（4）中所表示的该函数的输出值在1和1之间。它的主要问题是梯度消失了。它本质上是零中心的2xf（x）=1+e-2x（4）3. 整流器线性单元（ReLU）：此函数的输出值为Windows 10操作系统（win10）和RAM 32 GB。这些库包括pandas、numpy、matplotlib和sklearn。3.4. 深度学习性能评估指标DNN是本研究中使用的深度学习的一个例子，使用的性能指标是准确率，召回率，精度和F分数。在等式（5）中表示的是在0和无穷大之间。该方法计算效率高，解决了双曲正切函数中梯度消失的问题。此函数可用于深度学习中的隐藏层和输出层。它的主要问题是负值到零的转换。它比sigmoid函数的主要优点是它可以处理反向传播。等式（5）示出了ReLU的数学等式。R（x）=max（0，x）（5）如果x0，则R（x）= 0，如果x≥0，则R（x）=x<4. Softmax：函数的输出值在0和1之间，就像sigmoid函数一样。它只能用于深度学习的输出层Sigmoid和ReLU是本研究中使用的激活函数权重设置：初始权重必须为网络的第一个前向传递设置。这可以通过将权重设置为零或通过随机化权重来实现。3.3. 实验深度学习模型使用Keras函数API进行训练，在Google Colaboratory在线平台的TensorFlow上运行Python 3.6 notebook。图4a和图4 b中所示的架构设置是3层深度全连接网络，其具有CPDU激活功能，架构层分别为15-20-20-40-1和15-20-20- 40-5。训练数据被分成一个30%的验证集，运行40个epoch，并在验证丢失时提前停止监控。优化器是Adam，学习率为0.01。初始深度学习网络用于对训练模型中的所有五个目标变量进行联合分类，如图4 b所示。另一个网络也被设计来分类五个目标变量的每个元素，如图所示。凌晨4该研究在Google Colaboratory Notebook上使用Python 3运行时实现。深度学习训练和验证使用具有以下配置的运行时引擎完成。（下一栏）混淆矩阵也称为列联表，是四个象限中表格形式的行和列的组合，用于呈现分类器的分类结果[37]。在提供公式后，它协助计算业绩评价指标。真阳性（TP）：表示患者被正确分类为患有PDD真阴性（TN）：表示患者被正确分类为未患有PDD假阳性（FP）：表示患者被错误分类为患有PDD假阴性（FN）：表示患者被错误分类他们没有患上PDD。(a) 准确度是真阳性和真阴性的数量之和（正确预测的数量）除以所做预测的总数。准确度=TP+TP+TN(b) 精确度也可以称为阳性预测值（PPV），是真阳性数除以真阳性数和假阳性数之和。精密度=TP(c) 回忆是真阳性的数量除以真阳性和假阴性的数量之和。回忆的另一个名称是敏感性或真阳性率。召回= TPTP(d) F-Score是回忆（敏感性）和精确度。 Fscore =2* 查全率 * 查准率4. 结果在训练深度学习模型时获得的损失和准确度的多标签分类结果分别如图5和图6所示。保留一部分训练数据（30%），以验证模型在训练期间的性能。结果表明，通过跟踪验证损失的变化，模型在36次迭代后无法学习新的数据集分为70%的训练数据和30%的验证数据。结果说明了模型和验证精度之间的比较。通过保持特征变量相同，但改变目标以表示症状来执行单标签分类的评估不平衡和平衡数据集的分类模型的准确性结果分别见表1和表2从结果来看，使用I. Elujide等人医学信息学解锁23（2021）1005457图五. 多标签分类丢失。表1见图6。多标签分类的准确性。曲线下面积（AUC）为93%。这表明该模型具有更高的真实性，单标签和多标签分类模型在具有类别不平衡的数据集上的准确性结果。深度学习型号（%）验证（%）多输出（多标签）0.77860.7517失眠0.79290.7417精神分裂0.92500.9000血管性痴呆0.85360.8010ADHD0.77860.6500双相情感障碍0.81430.7667表2单标签和多标签分类模型在没有类别不平衡的数据集上的准确性结果。深度学习型号（%）验证（%）多输出（多标签）0.58230.5587失眠0.65260.5137精神分裂0.70150.6627血管性痴呆0.63580.5451ADHD0.70510.6078双相情感障碍0.68630.5294精神分裂症作为目标，在具有类不平衡的验证数据集上产生了90%的最佳性能。然而，使用ADHD作为目标产生了77.86%的准确率，并且在测试数据上也产生了65%的分类准确率的最差结果。在本节中，我们提供了本研究中进行的实验的结果（见表1和表2）。4.1. PDD分类和随机森林混淆矩阵的ROC曲线为了验证从准确度获得的结果，我们调查了更少的假阳性。另一方面，双相情感障碍模型表现出最差的表现，AUC为71%。对于混淆矩阵X，左上角到右下角对角线中的所有值都是正确分类的数据样本，如图8所示。现在，在我们的验证集中，如果你得到列的总和（从左到右），你会得到该类中存在的总样本为例如，在第一行中，总共0个样本是23 + 1 =24。这意味着在实际的验证集中，我们有24个属于“0”类的样本，其中我们的模型正确预测了23个（95.8%）。对于观察级该模型表现不佳，仅正确分类了6个样本，并将大多数数据样本错误分类为不同的类别，其准确率为28.6%。在这里，模型在这个类上过拟合。这表明训练中属于类“11 "的数据样本是不够的。4.2. 结果讨论我们发现，从统计分析报告的参考。[50] 40.2%的人对双相情感障碍、失眠症、精神分裂症、多动症和血管性痴呆的检测结果呈阳性，分别为40.6%、75%、43.6%和69.2%。这意味着数据集中存在需要平衡的类不平衡，以避免分类准确性的偏差，这也是参考文献中没有解决的问题[3]的文件。为了解决本研究中的数据不平衡问题，我们使用合成少数过采样技术（SMOTE）从现有样本中生成合成样本。一开始我们遇到了挑战该问题是一个多标签分类任务，而不是传统的多分类问题，其中有一个目标变量，但超过2类。因此，多类SMOTE方法不会直接工作。因此，我们首先将多标签转换为多类问题。我们的目标变量依次是：精神分裂症，精神分裂症，血管性痴呆，多动症和双相情感障碍.每列包含正值或负值。负值或N值编码为0，正值或P值编码为1。因此，前五个数据样本被编码为：使用受试者工作特征（ROC）进一步建模，混淆矩阵单标签深度学习分类的ROC曲线见图7。它显示了真阳性率和假阳性率之间的关系。值得注意的是，精神分裂症的模型产生更好的性能，精神分裂症血管性痴呆ADHD双相情感障碍0 1 1 1 01 1 1 0 1（接下页）I. Elujide等人医学信息学解锁23（2021）1005458见图7。 PDD分类的ROC曲线（续）见图8。随机森林混淆矩阵。数据帧。11001失眠精神分裂血管ADHD双极目标11111痴呆障碍01100011100111011101111011100111001然后将看起来像上述五个的整个目标变量组合在一起。该组合显示在11111111110110001100I. Elujide等人医学信息学解锁23（2021）1005459目标列现在形成了我们的多类变量。发现该列中的值包含19种不同的组合。当我们检查分布时，我们发现有些组合只出现一次，有些组合出现两次，有些组合出现5次，有些组合出现10多次。发现的不同组合是01110，11100，11101，11001 、 11111 、 01100 、 01000 、 01111 、 10001 、 10011 、00000、10111、11011、00100、00110、01010、10101、00010和10100。在Smote建议，为了获得良好的性能，建议我们至少有6个邻居。因此，我们删除了出现次数少于6次的所有组合。删除的组合为11100、01111、10011、00110、00010、10100、10111。在去除少于6个的组合（数量为7个）后，以下是剩余的组合01110,11101,11001,11111,01100, 01000，10001，00000，11011，00100，01010，10101。然后，我们将SMOTE应用于数据，使得每个样本各自具有总共101个样本。我们进一步对数据集进行分析以计算特征重要性，图如图9所示。如图9所示，年龄是从随机森林模型得出的对PDD分类贡献最大的特征，其次是职业，离婚是最小的。我们进一步在训练数据（占整个数据的80%）上训练多层感知器（MLP），支持向量机（SVM），随机森林（RF）和决策树（DT）。这四种算法在测试集上进行评估（这是采样数据的20%）。准确度和平衡准确度如表3所示。我们在机器学习技术上的结果与[3，50]在准确性，平衡准确性和影响PDD的属性的相关矩阵方面进行了比较基于准确度，我们提出的研究与SVM、RF和决策树相比，MLP表现更好，而RF优于SVM、MLP和DT基于平衡的准确度，如表3所示。MLP和RF的表现也优于Ref中采用的最佳集成机器学习[3]，分别基于准确度和平衡准确度，如表3所示。4.3. 基于准确度和平衡准确度的技术评价根据数据集的最佳准确度，获得了不同的验证准确度，如表4和表5所示，表3机器学习技术的结果比较。算法精度（%）平衡精度MLP0.58436213991769550.5853072853072853SVM0.46913580246913580.4982219169719169RF0.46913580246913580.6406784188034188DT0.46913580246913580.4982219169719169表4在类别不平衡的情况下，多标签分类的准确性。技术最佳准确度（%）作者LC-朴素贝叶斯树（多标签）56.56[3]第一章LC-朴素贝叶斯（多标记）56.56[3]第一章深度学习（Deep Learning）75.17本研究拟议（ML-MLP）58.44本研究表5平衡多标签分类的准确性，而不会出现类别不平衡。技术最佳准确度（%）作者深度学习（Deep Learning）55.87本研究拟定（ML-RF）64.07本研究不平衡和最佳平衡的准确性与来自不同研究的平衡类的数据集。这是在同一数据集上使用不同技术实现的。提出的深度神经网络-多层感知器（DNN-MLP）和机器学习-多层感知器（ML-MLP）优于表4中的其他方法。使用深度神经网络和具有平衡类的RF的机器学习进行的提议和研究如表5所示。在平衡数据集后，我们发现机器学习-随机森林（ML-RF）优于机器学习-多层感知器（ML-MLP），而ML-RF分类性能低于深度神经网络。图9.第九条。影响PDD的特征相关矩阵。I. Elujide等人医学信息学解锁23（2021）100545104.4. 基于影响PDD的特征的技术评价影响参考文献[50]和拟定研究的PDD的特征基于统计方法，使用χ2统计和机器学习方法，使用成对相关函数，如表6所示。在这项研究中，结果表明，有一个高的倾向，为双相情感障碍患者有失眠。这一主张得到了Ref的支持。[53]因为在双相情感障碍中，除了职业之外，影响他们的特征几乎我们在表6中的发现得到了参考文献的[50、53]。双相情感障碍和失眠症密切相关，R值为0.98，如图所示。10个。双相情感障碍和失眠在老年人中也最普遍。图10还显示，婚姻压力也可能使已婚夫妇容易患多动症，而失眠和双相情感障碍在单身患者中更高4.5. 深度学习在PDD上比机器学习更好吗尽管深度学习技术已经取得了成就，但它的优势并不能在现实生活中的所有情况下得到证明。大多数研究人员得出结论，深度学习技术将始终优于机器学习技术[54，55]。在本研究确定的所有情况下，情况深度学习优于机器学习，考虑到包含成像和非成像原始数据的数据集，如在一些系统性文献综述中建立的[5]。我们确定，从多分类准确性的角度来看，深度学习在具有类不平衡的PDD数据集上优于机器学习，而在具有平衡类的PDD许多研究也支持这样一个事实，即机器学习在小样本数据集上的表现将优于深度学习，正如本研究所本研究中的深度神经网络算法在精神障碍数据集上的性能，使用两个分割（训练和验证）产生了良好的结果，当用于同一算法的三个分割（训练，验证和测试）时，由于样本量较小，结果较差。其次，基于深度学习-多层感知器算法的多分类的准确性在类不平衡数据集上很高，因为偏向于大多数类，但在平衡类上很低5. 结论精神疾病的诊断越来越复杂，因为症状令人困惑。此外，一些患者不能清楚地表达他们的心理健康状况和疾病一个适当的诊断工具是必要的，以协助医疗表6影响PDD的属性。技术特点作者见图10。 PDD中的特征重要性医生区分和正确诊断精神障碍。因此，本研究将PDD作为一个多标签分类问题，以研究深度神经网络和机器学习架构和技术的使用-多层感知器（MLP），支持向量机（SVM），随机森林（RF）和决策树（DT）。这样做的目的是为了识别患者数据中的隐藏模式架构是宝贵的工具，作为数据中的相关性，通过它可以得出迭代优化技术。所获得的结果表明，与参考文献[56]采用的机器学习方法相比，深度学习神经网络基于准确性，真阳性率和假阳性率以及AUC提供了良好的分类性能结果。本研究中提出的方法以及在以前的研究中对同一数据集使用集成机器学习都表明精神分裂症在准确性方面表现最好，而ADHD表现最差。局限性在于，与从深度学习的角度对同一数据集进行训练/测试分离相比，使用时间验证的效果很差。这些结果表明，将深度学习模型应用于PDD可以获得患者表示，从而提供改进的临床预测，并增强机器学习框架以做出临床决策。深度神经网络算法在精神障碍数据集上执行，使用两个分割（训练和验证）产生了非常好的结果，当用于同一算法的三个分割（训练，验证和测试）时，由于样本量小，结果很差。结果显示，深度神经网络在类别不平衡准确度方面的表现优于75.17%，而MLP模型的准确率为58.44%。相反，

下载后可阅读完整内容，剩余1页未读，立即下载