噪音鲁棒的深度和传统机器学习堆叠集成用于心电图信号的生物特征识别

117 浏览量更新于2024-01-06 收藏 885KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

医学信息学解锁21（2020）100469一种新的噪声鲁棒的深度和传统机器学习分类器堆叠集成（NRSE-DCML）用于心电图信号Noushin Rabinezhadsadatmahaleha，Toktam Khatibib，*a伊朗德黑兰Tarbiat Modares大学工业和系统工程学院bTarbiat Modares大学工业和系统工程学院，德黑兰，14117-13114，伊朗A R T I C L EI N FO保留字：生物特征识别心电图（ECG）信号抗噪堆叠系综卷积神经网络（CNN）A B S T R A C T背景：生物特征识别优于传统的认证方法，例如密码、PIN（个人识别号）和/或基于令牌的卡。心电图（ECG）信号由于其心脏形态和结构而表现出独特的行为特征，这使得它们更适合于人体识别。ECG更安全可靠。用于从ECG信号中识别人体的相关先前模型可以分为常规机器学习和深度学习模型。在这项研究中，提出了一种新的噪声鲁棒性堆叠集成的深度和传统的机器学习模型（NRSE-DCML）的人识别ECG信号。方法：NRSE-DCML包括第一层的深度卷积神经网络集成，第二层的支持向量机集成和第三层的具有Softmax激活函数的感知器分类器。这项研究利用了传统机器学习模型和深度神经网络的优势，将它们结合在NRSE-DCML中。所有的心跳被用来训练所提出的堆叠集成分类器的第一，第二和第三层。第一层和第二层尝试识别噪声心跳并增加其权重以减少其误分类错误。来自PhysioNet数据库的152名健康和患者的PTB-Diagnostics ECG信号用于评估和验证NRSE-DCML。结果：实验结果表明，NRSE-DCML在使用1秒片段的5倍交叉验证策略下，准确度达到99.02，FAR为0.95，FRR为1.02，与其他最先进的方法相当。结论：我们提出的方法的主要优点是它能够检测未知的人作为未经授权的类，并考虑健康和病人群体。最后，我们提出的模型提高了准确性的生物特征识别噪声心跳。1. 介绍与传统的人类身份验证方法（如密码、身份证或加密密钥）相比，来自生物特征数据的人类身份验证具有一些优势[1]。对于传统的身份验证方法，诸如丢失或未经授权的复制等几个问题会降低其安全性[2]。生物特征数据是一种安全的人类身份识别方法，具有增强的安全性，没有复制，伪造数据和未经授权的人使用它们的风险[3]。在以前的研究中，许多不同类型的生物特征被用于识别个人不过，可以伪造[5]。例如，使用明胶可以损害指纹[1]。心电图（ECG）信号捕获心脏电信号。ECG作为一种生物计量模式，根据心脏形态和结构显示出独特的行为特征[2]。先前的研究表明，使用ECG作为生物特征的主要优点是即使在异常心跳中也能达到高准确性[6]。由于每个受试者的唯一性和固有属性，复制和拷贝ECG信号是困难的，甚至是不可能的[1]。此外，它们具有活性检测的能力。根据与以前的研究相比，不同的生理和几何特性以及不同的心脏位置和大小已经被检测到，* 通讯作者。电子邮件地址：toktamk. modares.ac.ir，toktamk@gmail.com（T.Khatibi）。https://doi.org/10.1016/j.imu.2020.100469接收日期：2020年7月7日;接收日期：2020年10月26日;接受日期：2020年10月27日2020年11月2日网上发售2352-9148/©2020的自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表医学信息学期刊主页：http://www.elsevier.com/locate/imuN. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）1004692个人[1]。ECG测量可以是一种低成本和常规可接受的方法[7]。使用ECG进行生物特征识别的一些优点是安全性高，活性检测和简单获取[8]。最近，已经引入了一些设备，这些设备可以基于易于使用和快速的模式捕获ECG信号先前的研究已经证明，可穿戴ECG传感器的ECG和心率变异性（HRV）与Holter监护仪相当[9]。因此，可以快速且简单地执行ECG捕获和生物特征识别。尽管从ECG信号进行生物特征识别具有优势，但其主要挑战是由于年龄、疾病和药物消耗而改变同一个人的ECG模式。因此，许多先前的研究都集中在提出不同的方法，心电生物特征识别。ECG可显示长期时间间隔内搏动形态特性的受试者内变化[7]。这使得从ECG信号中识别生物特征成为一项复杂而具有挑战性的任务。因此，本研究的主要目的是提出一种新的方法，从ECG信号的生物识别。2. 相关作品因此，从ECG信号中进行人体识别最近受到了广泛关注[3，4，10根据分析方法的不同，以往的ECG信号身份识别研究可分为两大第一类包括以前的研究，重点是传统的机器学习方法来分析数据。它们严重依赖于手工制作的特征，这些特征必须在将数据馈送到机器学习模型之前从ECG信号中提取[2，4]。特征提取方法的优劣对所开发模型的性能有很大的影响第二类由深度学习模型组成，可用作特征提取器和/或端到端模型[3，10]。特征提取器是在不同数据集上预先训练的模型[14，15]。数据被馈送到预先训练的网络，中间层的输出被提取为数据特征集[16]。然后将提取的特征集作为输入数据馈送到其他机器学习模型[16]。端到端深度神经网络可以在原始数据上训练[3，10]。它们可以同时从数据中提取特征并对其进行分类。但深度模型的主要缺点是需要大量的数据和较长的训练时间和内存。心电图中的噪声是一个必须考虑的重要问题由于电极与解剖标志或捕获设备的错位而产生的信号[7]。因此，需要设计一种抗噪声的分类器。单分类器对噪声敏感因此，以前的一些研究已经提出并使用了组合几个单一分类器的集成分类器[17，18]。已经证明，与单个分类器相比，集成方法对噪声更具鲁棒性，并且可以提高分类的准确性[19]。一些研究人员提出了在几个层中堆叠集成分类器以达到更好的分类性能[20]。验证系统试图回答“这个人是他们所说的那个并且是一对一匹配。识别系统试图识别未知的人或未知的生物特征，并且是一对多的匹配。验证比识别简单和快速得多我们在这项研究中的主要重点是人类识别。在这项研究中，提出了一种新的噪声鲁棒的深度和传统的机器学习模型（NRSE-DCML）堆叠集成从ECG信号中识别人体。NRSE-DCML具有三层，包括第一层中的深度卷积神经网络的集合、第二层中的支持向量机的集合以及第三层中的具有Softmax激活函数的感知器分类器。这项研究利用了传统机器学习模型和深度神经网络的优势，将它们结合在NRSE-DCML中。第一层和第二层的重点是识别噪声心跳并分别以高性能对它们进行分类。堆叠不同层的集合分类器的主要原因是减少噪声心跳的误分类误差表1说明了对先前关于从ECG信号识别人的研究的简要回顾。所列出的方法大多数都是对PhysioNet数据库中的心电信号进行分析的。从ECG信号中识别人体的研究可以分为传统的基于机器学习的方法和深度模型。第一组研究应该在训练分类器之前从数据中提取特征。例如，基准点的位置和形态描述符被用作特征。P-Q-R-S-T段的准确检测是获得合理的分类性能的必要条件。据我们所知，还没有提出和使用用于从ECG信号进行人体识别的集成的堆叠泛化。在这项研究中，提出了一个堆叠的合奏深和传统的分类器，以保持其优势，克服其局限性。在我们提出的方法中，不需要从数据中提取特征卷积神经网络（CNN）的设计和使用的第一层提出的堆叠集成可以采取原始ECG信号作为输入，并将它们分类。为了提高我们提出的人体识别方法的性能，并为我们提出的模型提供对ECG信号中噪声的鲁棒性，在CNN的集成中增加了两层并堆叠在一起。本研究的主要创新之处在于五个方面，包括：- 提出了一种抗噪声的心电信号人体识别方法- 提出了一种新的心电信号分类的层叠集成方法- 设计CNN用于ECG信号- 将深度卷积神经网络和传统机器学习模型结合在所提出的堆叠集成中，以发挥两组模型的优势- 将身份不明的人归类为未经授权的人- 以理想的性能对健康和患者组进行分类3. 方法基于CRISP方法的ECG信号人体识别方法的主要步骤如图所示。1.一、如图1所示，ECG信号被预处理以减少对信号的噪声影响。下一步是从预处理的信号中采样，并将其划分为训练和测试数据集。在训练数据集上训练所提出的分类器，即深度和常规机器学习分类器（NRSE-DCML）的噪声鲁棒性。最后，NRSE-DCML通过将其应用于测试数据集来评估。有关每个步骤的更多详细信息，请参见下一小节。3.1. ECG数据集在这项研究中，ECG信号从PhysioNet数据库的PTB-Diagnostics数据集获得。我们考虑的数据集包括52名健康人和100名患有某些心血管疾病的人的ECG信号。他们的年龄在17岁到87岁之间。对于每个人，记录1至5个ECG信号。信号的最大长度为120秒。使用12根主要导线和3根附加导线以1000 Hrz的采样率捕获这些信号。使用通过将电极定位在人的胸部上而捕获的静息ECG信号在这项研究中，由第一引线获得的信号进行了分析。N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）1004693表1简要回顾了从ECG信号中识别人体的研究（HI：生物识别，HV：人体验证）。方法机提取健康受试者学习方法[22]HV科目[23]HI[24]HI信号去噪基准（QRS）和非基准点提取K-NN，SVM高速已在63个主题K-NN高速和准确性仅在PTB-Diagnostics数据库[13] HI信号去噪和归一化小波系数RBF神经网络已在90个科目上进行了测试[1]基于RBF的支持向量机基准点提取内核计算复杂度低仅对PTB-Diagnostics数据库[2]信号去噪和重复的节拍来发出同样长度的信号计算节拍K-NN低计算复杂度已经在55个实验对象身上进行了测试美国[4][11]滤波用于信号去噪、离群值检测和归一化从匹配追踪系数提取统计和非线性特征k-NN概率神经网络（PNN）LDA，K-NN，MLP，LR，SVM，NB，XGBoost和RF提取非基准特征（不需要找到基准点位置）比较多个数据集已经在90名参与者的清洁心电图上进行了测试，未描述[16]信号去噪、余弦变换和CNNSVM和MLP已在100例受试者深度模型[3]信号去噪和归一化-在52名健康受试者身上进行了测试[8]信号去噪和分割[10]信号去噪和将信号转换为图像绘制三维时频图端到端CNN不需要功能提取2-D CNN不需要特征提取-已经在42个实验对象身上进行了测试3.2. 心电信号预处理图1.一、提出了一种从心电信号中进行人体身份识别的方法。从PhysioNet数据库提供的相应注释文件中提取。然后，对于每个R峰，提取Paiva等人已经证明，1 s段足以进行准确的生物识别[1]。因此，每个ECG信号被分割成长度为1 s的相等大小的段。ECG心跳由P-Q-R-S-T基准点组成ECG信号的R峰是R峰位于其中心的ECG。ECG信号可能具有一些噪声和伪影。以往的研究已经提出并使用了不同的信号去噪方法来降低心电信号的噪声，如平均，滤波和小波变换类型的方法作者，年份问题预处理方法特征提取分类器方法优势言论常规[21日]嗨–形态特征–高速仅在29N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）10046941（）=[1]。在这项研究中，为了减少噪声对心电信号的影响，带通滤波的基础上巴特沃斯变换。然后，信号被归一化为[0，1]。带通滤波用于减小生物信号的基线漂移以及运动伪影和高频噪声的影响。如果正确选择带通滤波器的参数，则ECG信号的高频Q-R-S复合波相对于信号的低频P和T波、低频噪声和50 Hz电力线伪影的背景的适当隔离是有保证的。为了调整带通滤波的参数，使用Fedotov提出的方法[26]。通过随机过采样策略从原始训练数据集中独立地选择用于训练每个CNN。CNN以并行模式训练。将CNN视为第一集成层中的基础分类器的原因是它们作为端到端模型从原始信号中提取特征层次的能力，而不需要从先前的信号CNN可以同时提取特征和分类此外，在先前的研究中，它们已经显示出对ECG信号进行分类的合理性能[3]。基于CNN分类器之间的一致度为每个实例分配置信度得分，以预测其类别标签，如等式2所示。（1）：confidenceScore实例分配给实例的分类器的最大数量分类器数量（一）3.3. 从数据中在本研究中，考虑了PTB-Diagnostics的三个数据集，包括：- 数据集1由100个患有心血管疾病的人的ECG信号组成。该数据集包括37，150个长度为1 s的ECG段实例。- 数据集2由52个健康人的ECG信号组成，从中获得9272个实例。- 数据集3是数据集1和数据集2的并集。每个实例的类标签是其对应的人类身份。对于每个数据集，随机选择一些人，并将其视为类别标签为未知的未授权人员。从未经授权的人的ECG信号中提取的实例不包括在训练数据集中。在这项研究中，每个分类器被定义为多个一对所有二进制分类器的集成。第i个一对一分类器将正面类和负面类分别视为训练数据集中的第i个人和所有其他人。如果一个实例被所有的一对多分类器分配了否定的类标签，那么它的聚合类标签将是未知的，他/她被认为是未经授权的人。为了将数据划分为训练和测试数据集，5倍交叉验证（CCV）。战略使用。K-fold C. V.是机器学习研究中使用的一种采样技术，用于将数据划分为训练和测试数据集。在该方法中，数据被划分为K个不相交的等大小的子集。每次，这些K个子集中的一个被认为是测试数据集，所有其他子集被认为是训练数据集。分类器在K个训练数据集上训练K次，并应用于相应的testi数据集以预测其输出。1s段被认为是ECG心跳。同一个人的ECG心跳被分成两个不重叠的子集（训练和测试数据集）。训练ECG心跳用于训练模型，测试ECG心跳用于评估和测试训练的模型。3.4. 设计、培训和应用NRSE-DCML我们提出的堆叠集成分类器（NRSE-DCML）由三层集成分类器组成，它们以正常堆叠模式堆叠在一起：- 第一层是在输入ECG信号上训练的它们的输出是每个输入信号的预测恒等类。训练样本ConfidenceScore1计算CNN分类器之间的一致程度，以将相同的类标签分配给实例。CNN-HHI和CNN-PHI被训练以分别在训练数据集中识别健康人和患者。换句话说，如果健康人xi的ECG信号被馈送到CNN-HHI，则它必须将该信号分类为属于“人x i”的类别但是，为了用CNN-HHI对患者Xj的ECG信号进行分类，该模型将其分配到“未知”的类别另一方面，CNN-PHI可以将患者Xd的ECG信号分类为其相应的“人x d”类别，CNN-AHI 1、CNN-AHI 2和CNN-AHI 3经过培训，可识别健康人和患者。Bagging策略用于对训练数据进行采样并聚合CNN的输出。因此，在这一层中使用的聚集规则是多数表决。CNN-HHI接受过认证健康人的培训。应将所有患者分类为未知类别。CNN-PHI旨在对患者进行身份验证，并将所有健康人分类为未知类别。CNN-AHI 1、CNN-AHI 2和CNN-AHI 3旨在验证所有患者和健康人。本研究中设计的所有CNN之间的差异在于它们的架构和超参数。此外，根据集成分类器的装袋策略，使用从原始训练数据集过采样的不同数据集来训练它们用于每个CNN的训练数据被划分为两个不重叠的子集，比例为80：20。较大的子集（TS）用于训练模型，较小的子集（VS）用作调整超参数的验证数据集。在时期期间比较了TS和VS的CNN性能，并调整了超参数和辍学率，以避免过拟合模型。此外，损失函数也被正则化以避免模型中的过拟合置信度得分低于预定义阈值（在本研究中为0.4）的实例被视为噪声数据。我们对噪声数据的假设是，由于其噪声，其分类容易出错。因此，基于分类器之间的一致度来选择阈值，以将类别标签分配给数据记录。我们的人类识别方法试图识别健康人（H）和患者（P）。为了给一个人分配一个真正的类标签，他/她必须被分配至少一半的分类器的真正的类标签对于一个健康的人，有4个分类器CNN-HHI、CNN-AH 1、CNN-AH 2和CNN-AH 3可以识别他/她，其中2个以上的分类器必须分配真实的类标签才能准确识别他/她。另一方面，对于患者，分类器CNN-PHI、CNN-AH 1、CNN-AH 2和CNN-AH 3可以识别他/她。如果超过2个分类器分配N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）10046952（）====对数据记录进行正确的类标签，可以正确分类。因此，阈值可以是2/4。NRSE-DCML的下两层集成分类器的主要重点是通过提高它们正确分类噪声数据的性能来- NRSE-DCML的第二层是基本分类器是传统机器学习分类器的集成。在这项研究中，支持向量机被用作第二集成的基础分类器。这一层的集成分类器是Sabzevari等人提出的投票提升集成[19]以增加分类器对噪声的鲁棒性。为了训练基本分类器，执行自举采样并顺序训练SVM。第一集成层中的基本分类器的输出形成第一 Meta 特征集（MF1）。支持向量机用于第二层分类MF1。将SVM作为第二层的基本分类器的主要原因在于三个方面，包括：- 支持向量机没有严格的理论统计假设，包括正态性、线性、方差齐性等。- SVM可以使用不同的内核对线性可分离和非线性数据进行分类。- 在以往的研究中，支持向量机在各种应用在我们提出的堆栈集成的第二层中的支持向量机的超参数是成本和核类型，使用网格搜索方法进行调整，最佳成本系数和核类型分别为10和SVM-Hi表示SVM分类器，其被训练为将i个健康人实例分类为阳性类，并且将所有其他人分类为阴性类。SVM-Pi将第i个患者实例分类为正类，将所有其他人分类为负类。每个实例的置信度得分在该步骤结束时更新为等式：（二）：其中，N2是NRSE-DCML的第二层中的分类器的数量，P表示正类标签。NRSE-DCML第二层的聚集规则是基于加权投票的提升策略。- 最后一层包括具有Softmax激活函数的感知器分类器。该步骤的主要目的是基于前一层获得的Meta特征完成实例的分类。Bootstrap抽样通过考虑实例的更新置信度得分和每个实例的不一致性得分（ICS）来执行，以提高分类噪声实例的准确性。作为第一层中的基本分类器的输出而产生的Meta features 1是第二层的输入，并且作为第二层的基本分类器的输出的Meta features 2被馈送到第三层作为其输入。为了将未知（和先前未见过的）人分类为未知类别，NRSE-DCML定义了属于预定义身份类别的概率的阈值。如果所有类别的最大概率小于预定义阈值，则该人被分类为未知。为了训练每个集成层，考虑所有训练样本。之后，为了评估模型并将其应用于之前未见过的数据记录（测试数据记录），只有AlfrediX C讨论了堆栈集成与单个模型和单层集成相比表现出优越性能的原因。3.5. 评价人的身份识别回答了这样一个问题：如果答案是肯定的，这个人被接受，否则，他/她被拒绝[7]。在以前的研究中用于人类识别的措施包括准确度（Acc），错误接受率（FAR），错误拒绝率（FRR）和时间导出的速度率（SR）。confidenceScore实例最小值（（负标签+1），分类器数量）分类器数量（二）如果SVM-Hi为实例分配了负类标签，则表示该实例未被标识为人员Hi。理想情况下，最多一个分类器必须为每个实例分配正类标签，以避免不同分类器分配的标签之间的不一致性。换句话说，为了防止不一致，分配给实例的负标签的数量必须大于或等于分类器的数量减1。实例的不一致性分数（ICS）可以计算为等式（1）。（3）：这些措施的公式示于Eqs。（4）正确拒绝次数+正确接受总数数据记录FAR不正确接受总数组间测验FRR不正确拒收数量组内测验（四）（五）（六）如果∑N2δ，则为0。PredictedClassLabe l.SV M）==P）≤1⎪⎨Jj=1μmICS=ΣN2δ。PredictedClassLabe l.SV M）P）1（三）⎪⎩⎪j=1N2-1=-否则，N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）1004696==- =2 ×调整阈值，使得FAR变为等于FRR。在这种情况下，FAR（或FRR）被称为等错误率（EER）。SR是决定接受或拒绝一个人的时间，必须在6到10秒之间[1]。表3比较NRSE-DCML的基本模型和集合用于考虑患有心血管病的患者的人类识别的性能。此外，人类识别是一项分类任务。因此，分类评估测量，例如灵敏度、特异性和F-评分，计算为等式：（7）模型精度（（TP+TN）/N）FAR（ FP/（ TN+FRR（FN/（TP+灵敏度特异性F-评分灵敏度TPTP+FN专属性TNTN+FPF评分灵敏度×特异性灵敏度+特异性（七）（八）（九）FP））其中TP和TN分别是模型真正接受和拒绝的数据记录数。FP和FN分别表示模型错误接受和拒绝的数据记录数。4. 结果如前所述，NRSE-DCML是堆叠在一起的三层集成分类器。第一层包括几个深度卷积神经网络作为其基础分类器。基本分类器的输出按列连接并形成称为元特征（MF 1）的矩阵。MF1被馈送到第二集成层作为其输入数据集。第二集成层由几个支持向量机（SVM）作为强大的传统分类器，它可以分类线性可分离和非线性可分离的数据与理想的性能。它们被训练来分类MF1数据集。它们的输出按列连接并形成一个名为MF2的矩阵XNRSE-人士97.182.732.8797.13 97.27 97.20MF2被馈送到堆叠集成分类器的最后一层作为其输入特征集。最后一层用MF2上的Softmax激活函数训练感知器分类器作为其输入。为了训练最后一层模型，使用Bootstrap抽样。为了评估和验证我们提出的堆叠集成分类器，应该计算每个集成层的性能，并与具有所有层的完整版本的堆叠集成分类器进行比较。为此目的，聚合第一和第二集成层中的基础分类器的输出。例如，当应该计算和报告第一集成层的性能时，应用并使用第一集成层的聚合规则（表3，4，5-所有CNN的装袋显示了NRSE-DCML模型的第一集成层的性能）。当应该报告包括NRSE-DCML的第一层和第二层的堆叠集合模型的性能时，使用并应用第二集合层的聚合规则，即SVM输出的投票提升最后，表3-表2给出了基本分类器和不同分类器的比较。NRSE-DCML的准确度、AUC、FAR、FRR、灵敏度、特异性和F评分方面的分层，用于考虑健康的人类识别表2显示NRSE-DCML与列出的分类器相比具有更好的性能。测试ECG心跳的总数是9284次心跳，这是基于5倍C. V.策略的总ECG段的约1/5。准确性显示了9284次测试心跳中有多少次被每个模型正确分类。为了验证结果，将实验重复50次，并且每次数据基于5倍的CV选择。大约10%的健康人和病人被排除在外，被认为是未知的人。我们提出的方法（NRSE-DCML）将这组人分类为“未知人员”的准确率为99.69%。表3呈现了被训练以识别患有心血管疾病的患者的不同分类器的性能测量。如表3所示，考虑到患有某些心血管疾病的患者，NRSE-DCML具有比用于人类识别的比较分类器更好的性能。表4列出了NRSE-DCML的基本模型和集合用于考虑健康人和患有心血管疾病的患者的人识别的性能。表4表明，NRSE-DCML使用5倍交叉验证策略实现了99.02的准确度，0.95的FAR和1.02的FRR， 0.69，与CNN分类器相比，其显示出优异的性能表2比较NRSE-DCML的基本模型和集成模型在考虑健康人的身份识别中的性能模型准确度（（TP+ TN）/N）FAR（FP/（TN+FP））FRR（FN/（TP+FN））灵敏度特异性F-scoreCNN-HHI92.97（6908/7430）7.06（262/3715）7.00（260/3715）93.0092.9492.96CNN-AHI193.54（6950/7430）5.55（206/3715）7.36（273/3715）92.6494.4593.54CNN-AHI293.81（6970/7430）5.13（191/3715）7.25（269/3715）92.7594.8793.79CNN-AHI393.42（6941/7430）5.84（217/3715）7.32（272/3715）92.6894.1693.41所有CNN97.38（7235/7430）1.42（53/3715）3.82（142/3715）96.1898.5897.36支持向量机在NRSE-DCML第二层中的投票提升98.11（7290/7430）2.12（78/3715）1.67（62/3715）98.3397.8898.10提振(1784/(39/(31/支持向量机（一八五四年）（第927条）（第927条）在二层NRSE-CNN-PHI91.887.838.4191.5992.2091.89(1703/(73/(78/（一八五四年）（第927条）（第927条）CNN-AHI192.148.207.4792.5391.8092.16(1709/(76/(69/（一八五四年）（第927条）（第927条）CNN-AHI292.077.847.9892.0292.1692.09(1707/(73/(74/（一八五四年）（第927条）（第927条）CNN-AHI392.118.497.2692.7491.5192.12(1708/(79/(67/（一八五四年）（第927条）（第927条）DCML(1802/(25/(27/（完成）（一八五四年）（第927条）（第927条）N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）1004697NRSE-DCML（完整版）99.83（7417/7430）0.14（5/3715）0.21（8/3715）99.7999.8699.82N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）1004698=（）=表4比较NRSE-DCML的基本模型和集合用于考虑健康人和患有心血管疾病的患者的人识别的性能。模型准确度（（TP+ TN）/N）FAR（FP/（TN+FP））FRR（FN/（TP+FN））灵敏度特异性F-scoreCNN-HHI93.52（8682/9284）6.58（366/5570）6.38（236/3714）93.6093.4293.51CNN-PHI94.18（8744/9284）5.87（492/8375）5.23（48/927）94.7794.1394.45CNN-AHI194.37（8763/9284）5.98（277/4622）5.27（244/4622）94.7394.0294.37CNN-AHI294.66（8789/9284）5.74（266/4622）4.94（229/4622）95.0694.2694.66CNN-AHI394.01（8729/9284）6.05（281/4622）5.92（274/4622）94.0893.9594.01所有CNN96.60（8969/9284）2.57（119/4622）4.23（196/4622）95.7797.4396.59支持向量机在NRSE-DCML第二层中的投票提升98.02（9101/9284）2.17（100/4622）1.79（83/4622）98.2197.8398.02NRSE-DCML（完整版）99.02（9193/9284）0.95（44/4622）1.02（47/4622）98.9899.0599.01表5评估NRSE-DCML在噪声信号上用于人体识别的平均准确度。在等式中称为平均精度模型（NR）。针对如表5所示的所有ECG测试信号计算用于人类识别的公式（14），而来自训练和测试数据集的一些ECG信号被随机添加噪声模型5%噪声样本百分之十嘈杂百分之十五嘈杂百分之二十嘈杂百分之二十五嘈杂如表5所示，NRSE-DCML优于比较的方法，而5-样品样品CNN-HHI92.1790.9280.7671.4861.52CNN-PHI92.2690.2280.8671.7763.67CNN-AHI192.4790.6781.6066.7562.00CNN-AHI292.6191.1581.3274.4761.90CNN-AHI393.0490.7682.2375.1163.80全部装袋94.1393.4590.3583.0179.07CNNs提高投票率96.7195.4293.4887.6982.43支持向量机二层NRSE-DCMLNRSE-DCML98.3097.1695.0291.2386.47（完成）版本）CNN的装袋集成和SVM的投票提升作为所提出的堆叠集成分类器的第二层，用于健康人和患者的人类识别。为了评估NRSE-DCML对噪声的鲁棒性，随机选择5%、10%、15%、20%和25%的ECG信号加入随机噪声。与先前的研究[27]类似，随机噪声被添加到具有不同标准偏差值（σ = 0.1至1.0）和零均值的频带20 Hz-500 Hz中的随机选择的信号中（μ=0）。.SDW中具有不同标准差σw的{0.1、0.2，0.3，0.5，0.8，1.0}被添加到仅NR %的ECG信号{5，10，15，20，25}。NRSE-DCML和其他比较方法在所有训练ECG信号上进行训练，其中NR%被添加了标准偏差为σw的随机噪声。对于指定的NR和指定的σw，每个模型的准确度计算如下：并且每个指定NR的每个模型的平均准确度被计算为等式（13）（十四）：当5-20%的样本变得有噪声时，精确度保持合理。当约25%的样本被添加随机噪声时，NRSE-DCML的性能下降，但仍然优于比较模型，具有合理的性能。为了找到CNN的最佳超参数和架构，对CNN的几个超参数和架构执行网格搜索，包括优化器、初始学习率、卷积块的数量及其相应的激活函数、卷积层中滤波器的数量和大小以及丢弃率。在NRSE-DCML的第一层中具有最佳性能的CNN的架构如图所示。 2包括具有卷积层和最大池化层的四个卷积块、丢弃层、平坦化特征图和用于分类的密集层。所有CNN，包括CNN-HHI、CNN-PHI、CNN-AHI1、CNN-AHI 2和CNN-AHI 3有着相同的结构。但是，它们是在不同的训练样本上训练的，因此，连接的权重是不同的。通过bagging策略对原始训练数据集进行双采样，为每个CNN选择训练数据集。CNN基于5倍交叉验证策略进行训练和评估，批量大小为16，Adams优化器和初始学习率为0.001。用于训练CNN的最大epoch数量是100 epoch。表6列出了本研究中设计和使用的每个深度模型的处理时间详情。CNN如表6所示，CNN的训练需要不到一个小时。在训练和收敛CNN之后，将它们应用于输入测试ECG信号需要几秒钟。因此，它们可以作为一种近实时的方法用于人体识别.在NRSE第一层中设计和训练的CNN中，精度模型NR.当NR%的信号加上标准偏差为σw的随机噪声时，模型的准确度（十三）标准差为σw的随机噪声（13）DCML，在NRSE-DCML的第一层的CNN中具有最佳性能的CNN的每个历元的准确度和损失函数如图所示。3.第三章。如图3所示，训练的准确度和损失函数和测试数据集是相似的，没有发生过拟合，平均准确率NR∑|SDW|准确度模型（NR。σw））=（十四）训练CNN。模型（w=1|SDW|最后，在这项研究中，所提出的方法的性能，NRSE-DCML的平均精度及其比较方法人类标识从心电图心跳是评估在另一数据集，并报告在BundiX B中。N. Rabinezhadsadatmahaleh和T. Khatibi医学信息学解锁21（2020）1004699图二. CNN的结构5. 讨论表7比较了在所提出的方法（NRSE-DCML）中从ECG信号识别人类的准确性与分析相同数据集（PTB-Diagnostics数据库）的先前研究。为了将我们的结果与以前的研究进行比较，表7中仅比较和列出了以前的研究，这些研究报告了相同数据集的结果。如表7所示，拟定方法显示出与先前研究相当的性能，其主要优势是与表7中列出的先前研究相比考虑了更多受试者。此外，该研究可以检测未知的人作为未知类。另一方面，实验结果表明，NRSE-DCML是一种抗噪声的身份识别方法。据我们所知，以前的研究已经报告了他们提出的方法在少数人身上进行人类识别任务的性能。例如，（ Israel et al. ， 2005 年），（ Coutinho 等人， 2013 ），（ Lei 等人， 2016 ），（ Paiva 等人，2017），（Tantawi等人，2015）（Labati等人，2018）和（Hanilçi和Gürkan，2019）分别考虑了PTB-Diagnostics数据库中的29、51、100、10、90、52和42人。在这项研究中，我们考虑了PTB-Diagnostics数据库中的152人。虽然，以前的研究，包括（以色列等，2005年），（Coutinho等人，2013），（Paiva等人，2017）（Labati等人，2018年），专注于从健康人而不是心血管患者的ECG信号中进行生物识别。（Hanilçi和Gürkan，2019年）指出，考虑心血管患者的ECG信号可能会恶化所提出的从ECG信号进行人体生物特征识别的方法的性能。（Hanilçi和Gürkan，2019年）报道了生物识别的准确率为88.47%，与其他先前的研究相比，这不是一个理想的性能[13，16]。对90例和100例患者的诊断准确率分别为99.7%和99.33%尽管在本研究中，考虑到100例患者，我们获得了99.83%的准确性。在这项研究中，包括健康人和心血管患者，以显示我们提出的方法对心血管疾病的鲁棒性，这可能会改变ECG心跳的形状和形态学特性，并增加从ECG信号的生物特征识别的复杂性。本研究的主要优点是在考虑所有健康人和心血管患者的情况下实现了非常理想的性能（准确度为99.02%）。此外，RNN和LSTM在以前的研究中已经显示出对时间序列和信号等纵向数据的理想尽管如此，以前的研究已经证明，将CNN用于时间序列和信号也可以获得理想的性能例如（Lei等人，2016），和（Labati等人，2018年）已经达到了99.33%和100%的准确率，分别从患者和健康人的ECG信号使用CNN的生物识别。因此，在这项研究中，CNN 被使用和设计在我们提出的堆栈集成分类器（NRSE-DCML）的第一层尽管如此，我们设计和训练了具有不同架构和超参数的LSTM，用于PTB-Diagnostics数据库中152人的ECG生物特征识别。考虑到152人，我们针对LSTM的调谐超参数的最佳设置导致94.82%的准确度。另一次，NRSE-DCML的第一层中的CNN被LSTM替换，并且在基于5倍的计算C.V.，其为99.01%。这表明在NRSE-DCML的第一层中使用LSTM而不是CNN并不能提高所提出的人类生物特征识别方法的准确性。最后，建议在未来的研究中在NRSE-DCML的第一层设计和训练CNN-LSTM模型，以将CNN和LSTM的特性和优势结合在一起，并评估该方法用于人体生物特征识别的性能。6. 结论基于生物特征的身份识别是近年来备受关注的一个研究课题。心电图是一种生物特征数据，其他人无法复制。此外，可以从该信号中检测出活跃性。因此

下载后可阅读完整内容，剩余1页未读，立即下载