卷积网络在心电图数据分类中的应用及数据增强方法的研究

34 浏览量更新于2024-01-09 收藏 1.12MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

医学信息学解锁26（2021）100729通过选择性增强提高全卷积网络的精度并应用于心电图数据Lucas Cassiel Jacarusoa，b，1a南加州大学，洛杉矶，加利福尼亚州，90007，美国bUniversitaütfürMusikunddarsteller-KunstGraz，Mondscheingasse7，8010，Graz，Steiermark，AustriaA R T I C L EI N FO保留字：完全卷积网络深度学习时间序列分类心电图数据数据挖掘A B S T R A C T深度学习方法已显示出适用于健康和医疗领域的时间序列分类，并在心电图数据分类方面取得了可喜的成果。成功识别心肌梗死具有挽救生命的潜力，在这一领域对深度学习模型的任何有意义的改进都是令人感兴趣的。传统上，当数据有限时，数据增强方法普遍应用于训练集，以改善数据分辨率或样本大小。在本研究提出的方法中，在数据稀缺的情况下不应用数据增强。相反，从中间测试集产生低置信度预测的样本被选择性地增强，以增强模型对与给定类别关联性较低的特征或模式的敏感性。这种方法被测试用于提高全卷积网络的性能。所提出的方法实现了90%的准确性分类心肌梗死，而基线的准确性为82%，这是一个显着的改善。此外，所提出的方法的准确性是最佳的限定的上限阈值附近的低置信度样本和降低，因为这个阈值被提高到包括更高的置信度样本。这表明专门选择较低置信度样本进行数据增强，对于使用全卷积网络进行心电图数据分类具有明显的益处。1. 介绍时间序列是指在自然界和社会中普遍存在的按时间顺序连续索引的数据时间序列分类（TSC）是数据挖掘的一个TSC的应用在包括农业，医学和发动机动力学[1-仅在过去四年中就引入了数十种新的TSC算法[4，5]。这一趋势随着真实世界数据集可用性的增加而加剧。任何内在有序数据的分类（时间或其他）都可以被视为TSC问题[4，6]，这使得现实世界的应用。本文中特别感兴趣的是医疗保健应用。急诊科通常无法检测到高风险的心电图（ECG）结果，导致可预防的伤亡，如Masoudi等人所示。[7]。心肌梗死（由于心肌缺血引起的心脏病发作）的早期检测是TSC模型可以对患者结局产生实质性影响的一个领域，具有挽救生命的潜力。可以说，TSC的最标准基线方法是与动态时间规整（DTW）相似性度量一起使用的最近邻（NN）分类器[8，9]。这种方法涉及使用DTW来计算样本之间的相似性，基于实现系列之间的最佳对齐所需的非线性“扭曲“程度DTW与NN分类已被证明难以超越缩略语：时间序列分类，TSC;心电图，ECG;心肌梗死，MI;动态时间规整，DTW;最近邻，NN;卷积神经网络，CNN;全卷积网络，FCN。电子邮件地址：jacaruso@usc.edu，jacaruso33@gmail.com。1邮寄地址：P.O BoX 3453 Idyllwild CA 92549.https://doi.org/10.1016/j.imu.2021.100729接收日期：2021年7月30日;接收日期：2021年8月23日;接受日期：2021年2021年9月8日网上发售2352-9148/© 2021作者。出版社：Elsevier Ltd这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表医学信息学期刊主页：www.elsevier.com/locate/imuL.C. 雅卡鲁索医学信息学解锁26（2021）1007292⃒即使使用更复杂的分类方法[9，10]。然而，研究继续探索NN分类器的独特集成方法以提高准确性[11，12]。深度学习方法在TSC应用中也获得了相当大的吸引力。传统上应用于计算机视觉[13，14]，卷积神经网络（CNN）和全卷积网络（FCN）的应用已经扩展到包括医疗保健[15]和自然语言处理[16，17]在内的领域。 CNN和FCN已被证明成功用于时间序列任务，包括TSC [18，19]。深度学习模型受益于大量的训练数据，因此时间序列数据增强方法在数据有限的情况下获得了兴趣[20]。时间序列的标准数据增强方法通常对现有样本进行轻微更改（或分割），稍后将进行审查。文献没有广泛讨论时间序列增强对健康和医疗领域内的FCN的性能影响。对于本文，数据增强对FCN架构性能的影响特别令人感兴趣，因为FCN一直被证明可以为TSC产生最先进的结果[21]。因此，本研究将重点关注FCN，而不是CNN或TSC的其他架构。本文的重点是通过以下方法来提高FCN的性能：一种基于中心假设的方法，即深度学习分类模型将倾向于数据中与给定类别更紧密相关的独特模式[5]。如果一个样本有许多与给定类密切相关的模式或特征，模型对该样本的预测自然会有更高的置信度。通过扩展，假设该模型将在包含与给定类相关性较低的特征的测试样本上产生较低的置信度预测。后者将简称为低置信度样本。本文探讨了将低置信度样本（来自中间测试集）的重采样片段引入训练集的可能性。一旦重新采样的片段被重新引入到训练集中，模型就被重新训练，然后在新的测试集上进行测试，以评估最终性能。这种方法背后的基本原理是松散的灵感来自人类的直觉。虽然没有官方的共识，但心理学和认知科学的许多权威认为直觉与分析推理并没有完全不同，只是与一个人的经验中不太明显的特征而不是更明显的特征相斗争[ 22-24 ]。将低置信度样本的片段重新引入训练集（其具有包含给定类别的不太突出的特征/模式的更强可能性）旨在以大致类似于直觉的方式略微增强对这些特征/模式的敏感性。然而，这种平行关系是谨慎地在这种情况下，修改后的实现的准确性与作为基线的FCN的常规实现相比来评估FCN。各种可调参数是新提出的方法所固有的，包括定义低置信度预测的阈值和要重新采样的片段大小。通常情况下，当数据不足时，数据增强普遍应用于数据集[20]。尽管存在大量的数据扩充方法（稍后进行综述），但文献中并不清楚选择或鉴定特定样本进行扩充的方法。在文献[25]中发现了使用选择性标准来鉴定合成生成的数据与真实标记数据的相似性的实践然而，这与使用选择性标准来决定在使用非生成方法时增加哪些样本是完全不同的，非生成方法对真实标记数据进行更改，这对于时间序列来说因此，仅增加低置信度样本的做法是非常规的，并且是主要的新颖性。更广泛地说，选择低置信度样本进行增强的概念实际上是在有关FCN或机器学习架构的文献中发现的。这里还值得一提的是增强技术，如Adaboost [26]，其表面价值在概念上与所提出的方法相似。boosting的核心概念涉及模型的顺序训练，通过增加错误分类示例的权重来解决先前模型的错误（或达到相同效果的重新排序[27]）。最后，所有的模型被集成并执行加权“投票”，以在推理时对新样本进行分类。boosting和这里提出的方法之间有一些关键的区别。首先，提升技术专注于增加错误分类样本的权重，并降低正确分类样本的权重，以便每个后续模型具有更高的正确分类前一个错误的可能性。这与所提出的方法完全不同，该方法侧重于增强低置信度样本，而不一定是那些被错误分类的样本。其次，所提出的方法在推理时不涉及分类器的集合序列，而是作为所提出的训练过程的结果产生一个最终模型。因此，所提出的方法和升压之间的根本差异有助于新提出的方法的新颖性所提出的方法是用来建立分类模型，心跳电活动该数据集具有两类示例心跳，一类是正常心脏活动，另一类是心肌梗死（MI）。因此，分类任务是二元的。在几个示例模型中评估了在新方法中改变参数的性能影响。本文的其余部分组织如下。在第2节中，相关的工作被重新审视，并提供背景上的FCN和现有的时间序列增强/转换方法的细节。第3节描述了所使用的数据，所提出的方法的架构，和实验装置。第4节详细介绍了新方法的结果，并将其与相同数据的基线进行了比较。在第5节中，提供了结果解释以及研究的潜在局限性。最后，第6节总结了研究结果，并讨论了未来的研究方向。2. 背景/相关工作2.1. 完全卷积网络首先由Wang等人提出。[28]，FCN已经显示出相当高的效率和对时间序列分类问题的适用性。在传统的CNN中，过滤器应用于输入数据以提取激活图或特征图[29]。过滤器（有时称为内核）在数据区域上移动以提取特征。然后通过局部池化层减小卷积特征的空间大小。局部池化提供的降维提高了计算效率[30]。以下等式描述了中心时间戳t的卷积：Ct=f。ωXt-l/2：t+l/2+b）n∈[1，T]（ 1）其中C是时间序列X上的点积（*）的结果，其长度为T。ω是长度为l的滤波器，b是偏置参数，f是整流线性单元（ReLU）激活函数。直观地说，对输入单变量时间序列进行卷积的结果是多变量时间序列，其中维数与滤波器的数量相匹配。对于所有时间戳，执行相同的卷积，即，使用相同的滤波器值和偏置参数。这允许一种称为权重共享的质量[31]，这有助于CNN在时间维度上学习不变滤波器的能力。请注意，在CNN架构中，在输出层之前会发现一个“密集”的全连接层。FCN本质上是一个CNN，它省略了前面提到的局部池化层，因此时间序列长度在卷积过程中保持一致。CNN中的全连接层也被省略了。因为FCN不包含完全连接的层（并且只使用卷积），所以它被称为“完全”卷积。与CNN相反，特征从卷积块馈送到全局池化层[32]，其中softmax层作为最终输出层。softmax函数返回以下值的归一化概率分布：L.C. 雅卡鲁索医学信息学解锁26（2021）1007293∑- +号图1.一、全卷积网络的架构。类（总是和为1），定义如下：时间序列超出了本文的范围，→下面用例子提供了方法的主要类别σ（σ）i=σj=1中文（简体）窗口切片技术是一种非常广泛采用的时间失真技术，用于 TSC主要是一个适应从计算机其中，是输入向量，输入向量的指数函数，k是类的数量，e是输出向量的指数函数。全局池取每个特征图的平均值，并将结果向量定向到softmax层，该层生成最终标签。换句话说，时间序列是在整个维度上聚合的，而不是在滑动窗口上聚合的（与局部池化的情况一样）。[ 44 ][45 ][46][47][48][49][4该技术涉及获取给定类的时间序列的片段，并在训练时将它们用作单独的序列（分配有相同的类标签）。给定时间序列T ={ti，ti+1，Si：j= {ti，ti+1，. tj}，1≤i≤j≤n。如果时间序列的长度为n，切片的长度为s，切片获得一组N <1的时间序列切片。因此，我们认为，切片（T，s）= {S1s，S2s1，.，（3）第一章[5]。Zhou等人[33]证明了全局池的优点* *+- +：其包括过拟合的减少。每个块由卷积层，批量归一化层（通过使用每个小批量数据的统计值对早期层的输入或激活进行归一化来加快收敛）[34]和ReLU激活层[35]组成。ReLU激活是整个深度学习过程中的标准函数，如果为正，则直接返回输入，否则返回零，作为解决消失梯度问题的一种方式。图1描述了下面的FCN架构。FCN在健康和医学方面的具体应用在文献中有丰富的内容。Xu等人。[36]将FCN应用于生物医学图像分割，并使用量化技术来减少过拟合。Tschandl等人[37]将FCN纳入皮肤病变图像分割模型，并显示性能与人类注释无法区分。FCNs最近已被应用于自动癫痫发作检测[38，39]。其他最近的应用包括肺肿瘤识别[40]、糖尿病患者的血糖预测[41]和心脏诊断[42]。显然，FCN在健康和医疗领域有希望。2.2. 时间序列深度学习模型往往在数据充足的情况下表现最佳。数据增强通常是处理数据稀缺和过拟合的有效选择。收集更多的标记数据并不总是可能的，因此在这种情况下，用人工生成的数据替代成为一个可行的选择。例如，用于图像分类的数据增强通常涉及现有样本的翻转，裁剪或几何变换[43]。然而，许多增强方法不能很好地转移到时间序列应用程序中，原因很简单，判断给定的变换是否保留了时间序列类的定义特征并不容易。例如，很容易确定对猫的图像执行的简单翻转是否离开然而，对于时间序列，很难从表面上评估变换方法是否过度干扰了重要的图案或特征。因此，这里审查的扩增方法大多是时间序列特定的，虽然有些是从海训方案以外的领域改编的。虽然涵盖了大量的非常规扩增方法，在上述方法中，作者将切片应用于训练集中的所有时间序列。有些方法属于特定领域的方法，因为它们适合于独特的应用。Lotte[46]提出了一种在脑机接口的背景下使用傅立叶变换和主成分分析来生成新数据的方法。在一篇论文中，等人[47]提出了用于医学传感器数据的多种方法，包括噪声模拟、幅度扭曲、排列、非线性时间扭曲、裁剪以及将数据乘以随机标量。上述研究是一个很好的例子，说明了对特定数据集具有数据增强价值的时间序列可以进行的可能更改的广度。其他增强方法旨在保留时间序列的流形，因为趋势和季节性是时间序列数据的重要方面。例如，在Forestier等人[ 49 ]提出的方法中使用DTW重心平均[ 48]来生成反映原始数据流形的加权平均值。值得注意的是，虽然最后一种方法生成新的合成时间序列，但大多数时间序列的增强方法涉及更改现有样本，而不是直接生成新样本。同样相关的还有呼吸技巧。恢复简单地说，就是通过模拟数据上降低的采样率（下采样）或借助插值（上采样）提高采样率来更改采样频率。在Zihlmann等人的一篇论文中。[50]，在CNN的背景下，心电图数据被重新采样用于数据增强目的。Cao等人。[51]通过连接ECG数据，重新搜索并从后一步选择随机增强序列，通过数据增强来提高神经网络的性能。这些增强方法普遍适用于训练集。Pala等人也使用Rescue来训练太阳黑子预测模型[52]，作为另一个领域的例子。在总结上述研究时，时间序列的数据增强方法可以分为四大类，它们可以在实践中结合起来：切片方法，特定领域的改变，生成方法和恢复方法。L.C. 雅卡鲁索医学信息学解锁26（2021）1007294-3. 数据和方法3.1. 数据本研究中使用的数据集是从UCR档案中获得的ECG 200 [53]。该数据集最初由Olszewski格式化并捐赠[54]，该数据集具有时间序列样本，每个样本代表单次心跳期间捕获的电活动。每个样本心跳必须属于两个类别之一：正常或心肌梗死。训练集和测试集各包含100个样本。每个时间序列样本的长度为96个数据点，没有缺失值，并以1或1作为类别标签（见图2）。注意，所有时间序列样本都已进行z归一化[55]。Z归一化定义如下：对于序列中的每个值，从所述值中减去时间序列平均值，并将差值除以标准偏差。这总是会导致输出向量的平均值大致为0和接近1的范围内的标准差。另一个预处理步骤是将类标签-1替换为0，因此预期的标签为0和1。3.2. 方法原始测试集被分成两个测试集，分别称为test_set_a和test_set_b。两个相应的测试集包含相同数量的样本。在本例中，test_set_a包含原始测试集的样本1到50，test_set_b包含样本51到100。Test_set_a被纳入模型构建过程，而test_set_b用作用于评估最终模型的真实测试集。训练集保持未操纵。所提出的方法分为以下步骤：1. 在训练集上训练FCN模型以构建原始模型。2. 生成的模型用于对test_set_a中的每个样本进行单独预测。在这些样本中，选择产生最低置信度预测的样本。具体来说，图二. Heartbeat Class Time Series EX samples.从每个样本的概率列表中的值生成绝对差（回想分类函数返回总计为1的类上的概率分布）。例如，如果分类器返回两个类的概率分布为[0.46590492，0.5340951]，则两个值之间的绝对值差将为0.0682 。如果分类器返回的概率分布为 [0.48288137 ，0.5171186]，则绝对值差将为0.03424。显然，后一个例子是一个较低的置信度预测。当然，可能的最低置信度预测是[0.5，0.5]的概率分布，其中样本属于任一类别的机会相等。分布中概率值之间的绝对差将简称为α。3. 选择低置信度样本（α值低于指定阈值）。在新方法中，用于限定低置信度样本以供选择的α值阈值本身是一个可调参数。在此步骤中使用各种α值阈值的结果分别进行了测试，并在各种实验模型中进行了比较（详见下文）。请注意，模型的预测是否准确在这一步是无关紧要的。只要α值低于规定的阈值，样品就可使用（唯一目的是提取样品及其标签用于后续步骤）。4. 低置信度样本在新的数据集中编译。5. 获得低置信度样本后，对每个选定的低置信度样本应用数据扩充过程，如下所示。从每个样品中切片并提取一个窗口。该窗口的大小始终为时间序列的70%，并且窗口的位置是随机确定的。该窗口大小不是任意的，而是被选择以确保仍然捕获样本中包含的大多数图案/特征，同时仍然允许轻微变化。由于所有样本都有96个数据点，因此切片的窗口长度始终为67。然后通过三次样条插值[56，57]对切片进行上采样和插值，使得所得系列具有与原始系列相同的长度。然后对所得系列进行z归一化。对于每个低置信度样本，整个过程经历两次，因此从以下数据生成两个新的结果时间序列：每个样品（请参阅图（3）：6. 新获得的z归一化级数（具有其原始类保留的标签）与原始训练集合并，使得新得到的训练集除了原始训练样本之外还将包含新增强的样本。7. FCN模型在新的扩展训练集上从头开始重新训练。8. 在test_set_b上评估新重新训练的模型的最终准确度/损失。新的重新训练的模型是该过程的最终结果。总而言之，该过程的完整图如下（见图1）。 4）：在基线中以及在新方法的模型训练阶段（步骤1和7）中用于训练FCN模型的超参数严格相同。模型是使用Keras [58]开发的，它在TensorFlow [59]之上运行。为了重现性，所有使用的超参数描述如下。正如图1所示，FCN总是有一个输入层，三个块（每个块由卷积层，批归一化，L.C. 雅卡鲁索医学信息学解锁26（2021）1007295图三. 一个示例时间序列的完整切片、插值和归一化过程。每个时间序列上的数据增强过程的输出是一对z归一化序列。L.C. 雅卡鲁索医学信息学解锁26（2021）1007296图四、新进程的地图。和ReLU激活层）、全局池化层和softmax层。每个卷积层有64个输出滤波器。每个卷积层的内核大小（即卷积窗口的长度）始终设置为3。通过将padding设置为“same”[ 60 ]，在输出中跨层使用的损失函数设置是稀疏分类交叉熵[61，62]，它计算标签和预测之间的交叉熵损失[63]以量化模型性能。有500个训练时期，使用的批量大小为32值得注意的其他设置是最佳模型保存和学习率降低。第一个简单地保存指定度量的最佳模型[64]，在这种情况下，验证损失。这有助于在验证集的性能开始下降而训练集的性能继续增加（过拟合）之前保存模型。第二个是为了在给定指标停止改善时降低学习率而实现的，这是Keras中称为ReduceLROnPlateau [65]的功能这被设置为使得学习率降低了一个因子，0.5（学习率的下限为0.0001），如果20个时期过去而没有任何验证损失改进。对于基线方法，FCN模型仅在根据新方法建立的模型可以超越基线，并通过系统地增加阈值和测试来确定最佳α值。α值范围为0.1 - 0.8（0.8接近观察到的概率值之间的最大绝对差）。4. 结果基线的准确度为82%，损失值为0.4115。结果表明，采用新的方法影响精度和损失。下表详细说明了基线和使用各种α值阈值构建的新模型的具体性能（见表1）。以下图表描述了准确度（见图5）和损失（见图5）。 6）在新方法下建立的每个模型中：表1测试的各种模型的准确性和损失结果模型α值阈值精度损失原始训练集，并在test_set_b上评估准确度/损失，中间步骤。接下来，在新方法下从头开始构建8个单独的实验模型，每个模型都有不同的α值，用作第3步中鉴定低置信度样本的上限。重新初始化随机种子（而不是在模型之间固定），并在这些模型中的每一个中使用随机训练/验证分割。α值阈值是不同测试中唯一不同的参数在test_set_b基线N/A 82% 0.4115型号1 0.1 88% 0.3343型号2 0.2 88% 0.3337型号3 0.3 86% 0.354型号4 0.4 88% 0.3512型号5 0.5 90% 0.3172型号6 0.6 84% 0.3592型号7 0.7 78% 0.4288和比较了 EX实验是结构化到确定是否型号8 0.8 86% 0.3873L.C. 雅卡鲁索医学信息学解锁26（2021）1007297图五. 在新方法下建立的所有模型的性能显示在准确性方面。5. 讨论图六、在新方法下建立的所有模型的性能以损失表示。广义上讲，损失变化是整体观察到的，最准确的模型具有最低的损失值（反之亦然）。实验结果表明，新方法在损失和准确性方面都具有明显的优势。在新方法下训练的所有模型（除了模型7）在准确性和损失方面都比基线具有更优的性能。表现最好的模型是模型5，达到90%的准确度和0.3172的损失值。由于基线具有82%的准确度和0.4115的损失值，这是一个有希望的改进。观察到损失的变化，尽管损失值有时仅轻微波动（例如模型3和模型4）。这可能是因为，如果类别区分阈值为0.5，则分类概率值的微小差异（即0.51至0.49）会导致全新的分类，而损失值仅略有变化。因此，一个差异可以存在于准确的预测中，而损失只有轻微的差异然而结果最初的推测是，将低置信度样本的扩增片段引入训练集中可以提高模型对不太突出的特征/模式的敏感性，从而提高整体性能。增加用于限定所述低置信度样本的上限阈值将允许增加更多数量的样本，直到所选择的样本不再是特别低的置信度。如果原始前提是正确的，则可以预期，将置信水平阈值增加到超过某个点将因此否定新模型的益处，该新模型应该仅选择性地增加低置信度样本。结果似乎与前提一致，使用0.5的α值阈值获得最高性能;一旦α值阈值进一步增加，性能再次下降。事实上，在所有的模型L.C. 雅卡鲁索医学信息学解锁26（2021）1007298在新方法下构建的，表现最差的都使用大于0.5的α值阈值。这似乎支持拟议办法的最初前提。回到曹等人的工作[51] Zihlmann et al.[50]，机器学习显然在ECG数据分类领域具有很强的实用性，并且通常可以受益于数据增强技术。这些结果建立在现有工作的基础上，通过证明潜在的有效性，以针对低置信度样本的技术，在ECG数据分类的背景下进行数据增强在所提出的方法中调用了Cui等人[45]引入的窗口切片技术（添加了上采样和三次样条插值）。在他们的工作的基础上，所提出的方法的结果表明，专门针对低置信度样本应用类似的增强技术，可以提高FCN架构的准确性和损失。在本研究的限制范围内，未就特定ECG数据应用之外的拟议方法的受益提出任何声明。其他潜在的局限性包括这样一个事实，即所提出的方法只有在初始模型正在学习时才有意义，而不是一旦它开始过拟合（当性能在训练集上继续增加而在验证集上下降时）。在后一种情况下，它会对大多数样本产生低置信度的预测，因此使前提变得毫无意义。学习率降低和最佳模型保存（在验证”（注1）“不可能”是指“不可能”，即“不可能”。作为如前所述，具有DTW的NN分类器是TSC的难以超越的标准，即使使用机器学习方法。根据Bagnall等人[4]对各种算法性能的系统评估，使用DTW的NN分类在ECG 200数据集上的平均准确率为82%。上述研究的作者还参考了BOSS算法[66]对于相同的数据集，它的表现最好，平均准确率达到89%。BOSS算法不使用机器学习或本文中涉及的其他概念，而是将子结构提取与降噪相结合的相似性度量。本研究中使用的基准FCN并没有提高DTW的准确性（两种方法都产生了82%的准确性），重申了使用传统机器学习架构超越DTW的挑战。然而，使用所提出的方法能够将FCN的准确性提高到90%，与BOSS算法的精度相当（并略高于BOSS算法的精度）。6. 结论在这项研究中，一个数据增强的方法，适用于心跳分类的FCNs进行了探索。该方法涉及低置信度样本的分割，在重新训练模型之前将其重新引入训练集。的结果进行了比较，以传统的实现的FCN。根据新方法建立的模型在准确性和损失方面总体上表现出比基线更高的性能（一个模型除外）。还为该特定应用确定了用于选择用于增强的低置信度样本的最佳置信度阈值。这项工作的未来方向包括测试所提出的方法在健康领域及其他领域的其他数据集上的适用性，以及与FCN以外的架构的适用性。在这项研究中，使用了一个固定的分割窗口大小，即原始时间序列长度的70%。这是一个适合进一步实验的参数。未来的工作还可以解决具体的方法来计算所提出的方法与传统的超参数优化固有的最佳参数。伦理批准和参与同意心跳时间序列数据从引用的公开可用数据源获得，并且通常用于机器学习研究。数据是匿名的，不可能获取个人信息本研究未收集新的个人数据。发表同意书作者同意出版这份手稿。数据和材料所有数据、材料和使用的代码可根据合理要求从相应作者处获得。资金这项研究没有从公共、商业或非营利部门的资助机构获得任何具体的作者LJ开发了本文提出的方法，设计了实验，建立了模型，并撰写了手稿。竞合利益作者声明，他们没有已知的可能影响本文所报告工作确认作者感谢Eamonn Keogh教授和那些承担了组装UCR时间序列分类档案的艰巨任务的人，以及这份手稿的匿名评论者。我们还要感谢马丁和李·巴德在大流行期间提供的庇护，没有他们，这项工作就不可能完成。引用[1] Abdoli A，Murillo AC，Yeh CCM，Gerry AC，Keogh EJ.时间序列分类改善家禽福利。在：2018年第17届IEEE机器学习和应用国际会议（ICMLA; 2018年，12月。p. 635-42 美国电气与电子工程师协会。[2] 张文龙，王文龙，王文龙.基于支持向量机的心跳时间序列分类。 IEEE Trans InfTechnol Biomed 2008;13（4）：512-8.[3] 杨伟，李伟，李伟.分析用于时间序列分类和机器性能的不同RNN自动编码器变体。机械系统信号处理2021;149：107322。[4] Bagnall A，LinesJ，Bostrom A，LargeJ， Keogh E.伟大的时间序列分类烘烤：最近算法进展的回顾和实验评估。Data Min Knowl Discov 2017;31（3）：606-60.[5] Fawaz HI，Forestier G，WeberJ，Idoumghar L，Muller PA. 时间序列分类的深度学习：综述。Data Min Knowl Discov 2019; 33（4）：917 - 63.[6] 甘博阿JCB。深度学习用于时间序列分析。2017. arXiv预印本arXiv：1701.01887。[7] 埃里克森角未能识别高风险心电图结果对急性心肌梗死患者护理质量的影响：Masoudi F，Magid D，Vinson D，et al. Circulation 2006; 114：1565-71。急诊医学杂志2007;32（4）：432.[8] 乌扎克湾在多变量时间序列分类中结合原始数据和标准化数据。 J IntellFuzzy Syst 2018;34（1）：373-80.[9] 凯特RJ。使用动态时间弯曲距离作为改进时间序列分类的特征。Data MinKnowl Discov2016;30（2）：283-312.[10] 王X，Mueen A，Ding H，Trajcevski G，Scheuermann P，Keogh E.时间序列数据表示方法与距离测度的比较实验。Data Min Knowl Discov 2013;26（2）：275-309.[11] Bagnall A，LinesJ，HillsJ， Bostrom A.使用COTE进行时间序列分类：基于变换的集合。 IEEE Trans Knowl Data Eng 2015;27（9）：2522-35.[12] LinesJ，Taylor S，Bagnall A. Hive-cote：时间序列分类的基于变换的集合的分层投票集合。在：2016年IEEE第16届数据挖掘国际会议（ICDM; 2016年，12月。第1041- 1046页。美国电气与电子工程师协会。[13] Li S，Chan AB. 11月）。基于深度卷积神经网络的单目图像三维人体姿态估计。上一篇：亚洲计算机视觉会议Cham：Springer; 2014. p. 332- 47L.C. 雅卡鲁索医学信息学解锁26（2021）1007299[14] Khan S，Rahmani H，Shah SAA，Bennamoun M.计算机视觉卷积神经网络指南。计算机视觉综合讲座2018;8（1）：1-207。[15] Acharya UR，Oh SL，Hagiwara Y，Tan JH，Adam M，Gertych A，San Tan R.一种用于心跳分类的深度卷积神经网络模型。Comput Biol Med2017;89：389-96.[16] 2005年10月27日，李文辉. Deepdocclassifier：使用深度卷积神经网络进行文档分类。在：2015年第13届文件分析和识别国际会议（ICDAR; 2015年8月。p.1111-5 美国电气与电子工程师协会。[17] 放大图片作者：J.用于语义分割的完全卷积网络。在：IEEE计算机视觉和模式识别会议论文集; 2015年。p. 3431- 40[18] 赵波，陆红，陈松，刘军，吴东.时间序列分类的卷积神经网络。J Syst EngElectron 2017;28（1）：162-9.[19] 刘庆林、蔡文惠、涂永忠.基于多变量卷积神经网络的时间序列分类。IEEETrans Ind Electron2018;66（6）：4788-97.[20] 刘B，张Z，崔R.有效的时间序列增强方法。在：2020年第13届图像和信号处理国际大会，生物医学工程和信息学（CISP-bmei; 2020年，10月。p. 1004-9 美国电气与电子工程师协会。[21] Karim F，Majumdar S，Darabi H.深入了解用于时间序列分类的lstm全卷积网络。IEEEAccess2019;7：67718-25.https://doi.org/10.1109/access.2019.2916828.[22] 爱泼斯坦·S揭开直觉的神秘面纱：它是什么，它做什么，以及它如何做到这一点。Psychol Inq2010;21（4）：295[23] NuthallPL，旧KM。直觉，农民回顾和分析。J Rural Stud 2018;58：28-38.[24] Hasko JL，Feigenbaum KD.解离与梦：进入潜意识。上一篇：梦与梦的故事Cham：Palgrave Macmillan; 2019.p. 121比47[25] Xue Y，YeJ，Zhou Q，Long LR，Antani S，Xue Z，Huang X.使用HistoGAN进行选择性合成增强，以改进组织病理学图像分类。医学影像分析2021;67：101816。[26] 沙皮雷EX plaining adaboost.在：经验推理。Berlin，Heidelberg：Springer;2013. p. 37比52[27] [10]李晓，李晓，李晓，李晓. 11月）。恢复或重新加权：提升实现的比较。2008年第20届IEEE人工智能工具国际会议。1; 2008年。第445- 451页。美国电气与电子工程师协会。[28] 王志，严伟，奥茨.使用深度神经网络从头开始进行时间序列分类：强大的基线。2017年国际神经网络联合会议（IJCNN; 2017年5月）第1578- 1585页。美国电气与电子工程师协会。[29] Albawi S，Mohammed TA，Al-Zawi S.卷积神经网络的定义在：2017年国际工程与技术会议（ICET;2017年，8月。第1-6页。美国电气与电子工程师协会。[30] 小林T. 卷积神经网络的高斯池化 2019年。[31] 刘涛，方S，赵勇，王萍，张军。实现卷积神经网络的训练。2015. arXiv预印本arXiv：1506.01195。[32] 林明，陈强，严世. 网络中的网络2013年。 arXiv预印本arXiv：1312.4400。[33] Zhou B，Khosla A，Lapedriza A，Oliva A，Torralba A.学习深度特征进行区分定位。在：IEEE计算机视觉和模式识别会议论文集; 2016年。p. 2921- 9[34] Loffe S，Szegedy C. June）。批量归一化：通过减少内部协变量偏移来加速深度网络训练。2015年国际机器学习会议（International Conference onMachineLearning）第448- 456页。 PMLR。[35] 放大图片作者：Kessler T，Dorian G，Mack JH.基于修正线性单元（ReLU）的人工神经网络在十六烷值预测中的应用在：内燃机科秋季技术会议。58318; 2017年。V001T02A006）。美国机械工程师学会。[36] 徐新，陆勤，杨丽，胡松，陈丹，胡英，施英。用于精确生物医学图像分割的全卷积网络的量化。在：IEEE计算机视觉和模式识别会议论文集; 2018年。p.8300- 8[37] 张晓鹏，李晓鹏，李晓鹏.用于皮肤病变分割的特定领域分类预训练完全卷积网络编码器。Comput Biol Med2019;104：111-6.[38] LiY，Yu Z，Chen Y，Yang C，Li Y，Allen Li X，Li B. 使用全卷积嵌套lstm的自动癫痫发作检测。IntJ Neural Syst 2020;30：2050019. 04.[39] O'Shea A，Lightbody G，Boylan G，Temko A.使用全卷积架构从原始多通道EEG检测新生儿癫痫发作。神经网络2020;123：12-25.[40] Nair G，Johnson S，Verma A，Ebenezer MPA.用于肺部肿瘤识别的全卷积深度神经网络。 Int J Appl Eng Res 2020;15（5）：431-5.[41] De Bois M，El Yacoubi MA，Ammi M.医疗保健中的对抗性多源迁移学习：应用于糖尿病患者的血糖预测。计算方法进展生物医学2021;199：105874。[42] 作者：Khened M，Kollerathu VA，Krishnamurthi G.使用分类器集合进行心脏分割和自动心脏诊断的全卷积多尺度残差DenseNets。医学图像分析2019;51：21-45。[43] Shorten C，Khoshgoftaar TM.用于深度学习的图像数据增强综述。Journal ofBig Data2019;6（1）：1-48.[44] Zhang C，Bengio S，Hardt M，Recht B，Vinyals O.理解深度学习需要重新思考泛化。2016年。 arXiv预印本arXiv：1611.03530。[45] 崔志，陈伟，陈勇.用于时间序列分类的多尺度卷积神经网络。2016. arXiv预印本arXiv：1603.06995。[46] 洛特·F在基于振荡活动的脑机接口中最小化或抑制校准时间的信号处理方法。Proc IEEE 2015;103（6）：871-90.[47] UmTT，PfisterFM，PichlerD，EndoS，LangM，HircheS，Kul i 'c D. 11月）。数据使用卷积神经网络增强用于帕金森病监测的可穿戴传感器数据。在：第19届ACM多模态交互国际会议论文集; 2017年。p. 216比20[48] Petit

下载后可阅读完整内容，剩余1页未读，立即下载