机器学习改善高血压患者生活方式管理

95 浏览量更新于2023-12-06 收藏 1.5MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

阵列12（2021）100090机器学习通过改变高血压患者的生活方式促进健康管理马里兰州Mazharul Islama，*，Rittika Shamsuddinba孟加拉国治理和管理研究所，孟加拉国达卡b美国俄克拉荷马州斯蒂尔沃特俄克拉荷马州立大学A R T I C L EI N FO关键词：高血压深度学习卷积神经网络健康管理基于扰动的仿真预测A B S T R A C T本文的目的是研究使用机器学习模型来开发高血压患者的诊断系统，以便人们可以改变他们的日常生活方式来管理他们的病情。我们提出了这个系统，通过采用显着地图的概念，图像数据，非图像，生活方式的数据与数据扰动模拟技术。我们在一个新的生活方式数据集上训练了这个系统，这个数据集是我们从一项对亚洲亚群的调查中提取的。所提出的系统由卷积神经网络（CNN）作为诊断模型组成，并与仿真技术相结合，以解释CNN学习的概念/见解。我们将CNN模型的分类性能与其他基线模型进行了比较，这些模型拟合了其他类型的高血压数据，包括神经网络，决策树和文献中的其他CNN模型。CNN在训练和测试数据集上达到了68-70%的准确率。与其他基线模型相比，我们的CNN模型在准确性，灵敏度，特异性和受试者工作特征（ROC）曲线下面积方面提供了更一致的性能。通过模拟，我们了解到CNN不仅捕获了变量与目标之间的直接相关性，还学习了基于组的交互。年龄、性别、糖尿病、体重指数、吸烟、职业、文化程度是影响高血压的重要生活方式因素。避免吸烟、保持均衡饮食以防止不必要的体重增加、定期监测血糖水平以进行糖尿病护理以及缓解压力的运动可以降低高血压风险。1. 介绍高血压的产生是由于持续的高血压水平，导致我们体内的血液循环。由于没有症状，“无声杀手“高血压是全世界主要的公共卫生问题，也是中风、心血管和肾脏疾病等各种非传染性疾病的重要风险因素。据世界卫生组织（WHO）估计，全球有11.3亿人患有高血压，其中超过80%的人无法控制病情[1]。以2010年为基线，世卫组织已采取全球行动，到2025年将高血压患病率降低25%[2]。[2-4 ]南亚国家的低收入/中等收入家庭面临的风险最高，这种情况因这些地区很少使用人工智能而恶化。因此，为了跟上全球趋势以应对当前的医疗挑战，必须开发客观，可解释的决策支持系统来诊断和理解高血压。虽然正确的诊断是实现世卫组织设定的目标的第一步，但如果患者不了解如何在其生活环境中管理自己的病情，高血压的流行率就不会降低。此外，医学数据，特别是生理数据，具有更高的机会捕获作为高血压症状的身体变化。然而，症状变化并不一定总是导致有效的治疗策略或病情管理。比如医学生理数据可以说一个病人有高血压，但是病人现在应该怎么办？病人有遗传倾向吗？患者是否应该简单地依赖药物治疗，或解决日常生活中导致高血压的刺激/压力源？由于遗传数据不易获得（遗传条件不可改变），药物可能很昂贵，特别是对于低/中等收入家庭/国家，有效的高血压管理策略可能涉及解决日常压力源或改变生活方式，必要时限制药物摄入* 通讯作者。电子邮件地址：mislam6@isrt.ac.bd（Md.M. 伊斯兰教），r. okstate.edu（R. Shamsuddin）。https://doi.org/10.1016/j.array.2021.100090接收日期：2020年12月28日;接收日期：2021年7月19日;接受日期：2021年在线预订2021年2590-00562021的自行发表通过Elsevier Inc.这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。可在ScienceDirect上获得目录列表阵列期刊主页：www.sciencedirect.com/journal/array医学博士Islam和R. Shamsuddin阵列12（2021）1000902通过使用ML模型进行简单的诊断分析来解决这个问题是很有吸引力的。然而，大多数使用ML模型进行诊断的分析都停留在使用诸如特异性、灵敏度、精确度、f1分数等指标进行ML模型预测性能评估。虽然这些评估指标在ML研究界是标准的，但它们并没有提供对ML模型实际学到的“什么”的任何见解，例如，ML模型是否诊断出由于长期压力史而患有高血压的患者，一次压力体验或病人的性别该模型是否检测到压力和性别之间的相关性？如果模型检测到相关性（或没有），根据我们目前的医学知识，这种相关性是否应该存在？因此，ML模型的“什么”与管理特定健康状况（在这种情况下为高血压）的适当可行策略直接相关，并且这可能因患者而异。毕竟，要改变生活方式，受影响的人首先需要确定哪些生活方式变量需要改变。虽然一些ML模型，如逻辑回归或决策树，有能力解释“什么”，但它们在具有跨类非线性模式的复杂数据集上表现不佳。据我们所知，尽管近年来已经看到了一个随着这一领域研究的激增（在第2节中讨论），目前还没有简单的解决方案来解决ML模型的“什么”和性能之间的这种权衡虽然这是一种有效的方法，其优点是主ML模型保留其性能能力，但由主ML模型学习的特征交互仍然不被第二模型检查。换句话说，第二个模型的特征交互被用作主模型的近似，但是除了保真度度量之外，没有对该近似的直接评估，该保真度度量简单地检查主模型和辅助模型是否都为给定实例提供相同的标签。为了使医疗保健研究的问题进一步复杂化，没有简单的方法可以自动将当前的医学知识纳入基于ML的诊断模型的评估中。因此，在本文中，我们的目标是：i. 利用最先进的ML模型的预测性能，其中大多数模型都被誉为ii. 利用不依赖于第二个ML模型的事后分析方法，而是尝试解释由主ML模型（在这种情况下也是“black-bo x“）学习的特征交互iii. 调查将主要ML模型的“什么”映射到现有医学文献和知识的可行性因此，我们建议采用以下方法进行调查：i. 为了确保高血压的诊断可以用一个可实施的行动计划来跟进，我们提取了一个生活方式数据集。（而不是生理数据集），其之前没有被分析过高血压，来自国际人口科学研究所进行的2015-16年印度国家家庭健康调查，2011年印度和孟加拉国人口与健康调查，由孟加拉国国家人口研究和培训研究所进行。ii. 由于来自计算机视觉的图像分析技术是一个研究领域，其中模型已被评估为主要最先进模型（无需第二个ML模型）学习的特征交互的语义，因此我们对其进行了修改，调整并将其应用于生活方式高血压数据集。因此，我们使用卷积神经网络（CNN）作为我们的主要ML诊断模型，并使用显着图的概念来分析新的高血压生活方式数据集。适应涉及一个建议的模拟系统，直接探测训练的CNN使用合成实例数据，并使用CNN响应中的变化iii. 为了评估该技术的适当适应性，我们将我们的系统的准确性与文献中发现的高血压预测模型的准确性进行了比较。我们还在同一数据集上训练了一棵决策树作为基准。iv. 为了研究ML模型从数据集中获取医学知识的可行性，我们还将从我们的系统中获得的见解与以下见解进行了比较：a）医学研究界重视的统计方法（包括逻辑回归的比值比），b）决策树，少数几个内在可解释的ML模型之一，以及c）已发表的文献。因此，我们在本文中的贡献包括：i）使用生活方式数据集来创建用于高血压诊断的深度网络，以用于状况的低成本管理，ii）提供一种在没有第二ML模型的帮助下解释模型已经学习了什么的方式，iii）适应和解释针对非图像数据的显著性图的使用，iv）通过与领域知识的比较来评估ML模型已经学习了什么，以及v）实现世卫组织减少亚洲亚人群中高血压病例的目标。虽然这项研究仍处于初级阶段，但我们希望这种研究方向/方法能够提高人们对医疗保健需求和挑战的认识，这些需求和挑战应该由ML研究社区等分析同行来解决。在这项调查中，我们发现，尽管是一个黑盒模型，但主要的CNN模型能够找到一些通过统计方法和现有文献合作的特征关联。仅基于我们使用模拟技术（不包括第二个ML模型）对CNN的分析，CNN模型将性别、糖尿病状况、年龄、BMI、臂围、婚姻状况、教育、吸烟造成的室内污染和拥有资产视为高血压的重要预测因素。在一个有趣的将地理作为预测因子的案例中，CNN模型与逻辑回归的结果不同，但得到了现有文献的支持。CNN模型还发现了一些我们在文献中找不到证据的特征相互作用，因此在本文中没有提出（我们在补充材料中列出它们）。然而，要确定这些相互作用是否只是噪音或人类忽视的高血压模式，需要进一步的科学研究。论文的其余部分组织如下：与我们的研究相关的研究见第2节。第3节描述了与第3.1节-3.3提供本文中使用的ML模型和统计方法的背景信息。模拟技术的详细信息见第3.4节，而数据集的相关信息见第3.5节。第4.1节介绍了ML模型（CNN）的性能评估、比较以及我们对其性能的讨论。第4.2节提供了模拟的结果和讨论，以研究CNN模型学习了什么。最后，我们强调了我们工作的局限性，并对未来的工作进行了简要的讨论。2. 相关作品为便于全面理解和比较，我们将本节分为四个小节。2.1. 数据集、模型、模型说明在本小节中，我们描述了使用ML模型进行高血压诊断的研究工作。我们比较了每项工作的方法，例如数据集类型，模型类型和理解模型的努力。生活方式数据集，不同的模型类型，没有模型解释：工作医学博士Islam和R. Shamsuddin阵列12（2021）1000903图1.一、卷积神经网络架构预测高血压。与我们的研究最相似的是[5]，它也使用了生活方式数据集，并进行了一些特别的努力来分析该特征。然而，他们的数据集是从美国人群中收集的，而不是南亚人群，以实现世卫组织的目标。此外，他们的特别努力（不像我们使用事后模拟来解释CNN）使用逻辑回归选择高血压诊断的重要特征，最好描述为特征选择技术。他们的方法包括使用逻辑回归来选择重要的特征，然后使用这个减少的特征集，他们使用具有一个完全连接的隐藏层的人工神经网络（ANN）作为诊断模型并使用一般ML度量（准确性、特异性、灵敏度和ROC曲线下面积）进行模型评估。我们使用的CNN模型是基于两个卷积层以及用于最大池化和平坦化的层（图1）。①的人。不同的数据集类型，相同的模型类型，没有模型解释[6]：是密切相关，因为他们也使用CNN模型来预测高血压;然而，他们使用不同的CNN架构，更有利于处理由三对1D卷积层和池化层组成的生理和波形数据，其中ReLU作为激活函数。他们使用的生理数据集取自公共领域MIMIC II波形数据库匹配子集，由每分钟收集1小时的8个生理参数（HR、ABPSys、ABPDias、ABPMean、CVP、PULSE、RESP和SpO2）的时间序列集组成。与这项工作不同[6]，既没有使用生活方式数据集，也没有解释他们的CNN模型正在学习什么。不同的数据集类型，不同的模型类型，没有模型解释：[7，8]在任何程度上都不符合我们的方法，除了他们也解决了高血压诊断的事实。两者都使用带有生理数据的隐藏层人工神经网络（ANN），专注于血压，高胆固醇等特征，并提供模型解释。在这一类别中，关于预测高血压，文献中有许多其他工作通过利用医疗数据（例如-电子健康记录，超声心动图，心肺数据，生理波形和其他临床数据）做出了很大贡献，但与我们在研究方法方面所做的工作没有直接关系[9]。对大学生数据使用分类树[10]，对来自德国东北部的受访者应用贝叶斯框架，[11]研究超声心动图肺动脉高压的预测。使用不同的机器学习技术[12]，通过心肺健康数据研究高血压风险，而[13]使用加拿大初级保健哨兵监测网络数据（临床数据）和完全连接的神经网络（ANN）。由于[5，6]在一定程度上与我们的方法相匹配，我们使用他们的方法。模型此外，从上文可以看出，目前大多数高血压研究旨在使用最先进的（深度和神经网络）诊断模型，但没有提供对模型所学习的内容的评估。因此，在下一小节中，我们将提供已经提出的计算技术来解释ML模型所学习的内容。2.2. 模型解释策略在过去的几年里，已经提出了多种方法来解决ML模型的准确性和可解释性权衡问题。其中包括使用模糊逻辑来解释神经网络[18]，通过数据扰动在实例的局部使用线性模型[19]，使用经过训练的深度网络结果来训练决策树，以及使用决策树结构来训练深度网络[20]。虽然这些方法有自己的优点[18]，但只能用于神经网络，而不能用于其他类型的网络，如卷积网络，递归神经网络等[20]，实现了创建一个非常接近深度网络准确性的决策树，但没有将深度网络作为预测模型进行探索，而是将其视为“Oracle”。虽然使用深度网络作为Oracle并使用它来训练决策树给了我们一些解释，但它仍然没有解决深度网络最初是否从数据中学习正确概念的问题[19]。是唯一一个试图解释通过复杂决策模型学习的概念，但使用第二个线性分类器来解释边界决策的局部性在这样做时[19]，忽略了数据集中可能存在的整体/全局相关性，并且它只通过简单线性模型的镜头间接探索了复杂模型。此外[19]，只关注文本数据2.3. CNN在高血压以外的医疗保健中的应用有大量的研究在医疗保健应用中使用CNN模型。在本节中，我们将介绍其中的一些文章，以提供应用领域的广度[42]。提出了一个案例，其中CNN模型用于创建具有电子健康记录（EHR）患者的一般患者相似性网络[43]。使用深度CNN模型来识别EEG（脑电图）时间序列数据中的指示性癫痫特征。在非接触式雷达系统检测呼吸模式不规则性的应用中[44]，显示1D CNN模型的准确性比传统ML模型高15%。ECG（心电图）时间序列数据能够捕获心跳异常，包括房颤，[45]使用基于LSTM（长短期记忆）的CNN检测房颤的准确率高达89.60%。在一个非常有趣的人机系统中，[46]使用CNN模型来处理残疾人头部运动的低质量图像，以在计算机屏幕上移动鼠标。其他数据驱动系统解决医疗问题的例子，不涉及高血压的研究包括减肥研究[14]、肥胖研究[15]、项目成本效益评估和电子健康记录分类[16，17]。2.4. 我们的方法与上述方法（它们本身都是巨大的贡献）不同，我们的方法论方法的动机一般来说，当在图像数据上训练的CNN上使用时，显着图描绘了对模型做出的决策具有最大贡献的图像的像素[21]。显着性图能够告知CNN模型是否基于目标特征的存在或不存在进行分类，或者它是否正在学习与目标特征相关的任何潜在特征。因此，比较由于输入变化而引起的显着性图的变化可以指导研究人员研究CNN学习的概念[21因此，我们建议使用CNN作为医学博士Islam和R. Shamsuddin阵列12（2021）1000904变平i、i，kmn，k诊断模型，并提出了一种模拟技术，该技术针对输入值的每次变化计算CNN输出的变化（例如，非图像数据的显着性图），使得它可以处理连续和离散特征变量。请注意，我们在这里提出的研究方法并不局限于我们在本文中使用的CNN架构。为了准确性比较，我们建立了基线模型，并验证了通常在卷积层旁边添加层，其通过实现平移不变性来有效地减小特征图维度。不变性包括任何变换、旋转、缩放、总结和识别某些特征的存在。池化层的其他重要贡献是保留重要特征，同时减少参数的维度并防止过拟合。用于特征CNN学习的概念，我们使用统计测试，天生可解释机器学习模型和发布的数据。ai，j，k，池化层输出将采用表达式，Qa+j，1=pool（Ya+，1），<$（m，n）∈βi，j在本节中，我们简要描述了本文中使用的CNN架构，基线模型，统计方法，拟议的模拟技术，数据集的细节和预处理步骤。3.1. 卷积神经网络（CNN）作为诊断模型其中βi，j是位置（i，j）周围的局部邻域。在本文中，我们实现了最大池（max-pooling）层，将特征维数降低到（16，24），而平均池在文献中也很常见。在最大池化之后，已经执行平坦化操作以将特征图转换为一维向量，大小384使用δL=flatten（δL），并且输出向量被馈送到完全由于其在数据集中发现隐藏关系的能力，CNN模型已被广泛用作各种医疗保健研究的预测/诊断工具。它使用i）卷积层，众所周知用于选择与目标分类相关的重要特征[24]，ii）批量归一化器，用于实现快速收敛[25]，以及iii）dropout层，以避免可能的过拟合[26]，使其成为高效的计算工具。因此，在本文中，我们使用图1所示的CNN架构。校正线性单元（ReLU）用作激活，以解决爆炸/消失梯度[27]。由于我们的研究包括二元分类（高血压与正常）和类概率，以帮助个性化治疗，我们在输出层使用SoftMax激活函数。CNN是一种多层深度神经网络架构，它采用输入层、卷积层、池化层、全连接层和输出层，其中卷积层是结构的核心组件。通过卷积层进行卷积，从输入信号中提取局部特征，其中属于同一特征图的神经元共享权重[6]。在本文中，我们有表格形式的数据，我们实现了一维卷积层。从卷积层提取的特征在转移到下一层之前被归一化。池化层被添加在两个连续卷积层之后，随后是相应的归一化。接下来，我们添加全连接层和输出层。卷积层产生多个特征图，包括多个神经元，其中每个神经元通过卷积核（权重矩阵X）连接到上特征表面。这里通过卷积运算从输入中提取不同的输入特征。卷积层的输出由输入和核的权重因子的点积计算。在这项研究中，我们实现了两个卷积层（图1）。采用修正线性单元（ReLU）作为激活函数，将负值修剪为零，保留正值，得到由滤波器确定的特征映射[6、43、46]。考虑由Xa表示的输入，特征值Ya+1连接层[6，43，46]。全连接层的主要任务是整合多个卷积层的特征在本文中，我们实现了两个节点大小分别为12和8的全连接密集层ReLU激活函数用于两个密集层，而第二个密集层与具有两个节点的输出层完全连接Softmax激活函数用于连接第二个密集层的输出层[6，43，46]。3.2. 基线模型描述：文献决策树分类是最流行的分类技术之一，它既简单又易于解释。决策规则显式地说明了特征贡献，它决定了一个实例是属于正类还是负类。在这项研究中，我们实现了决策树，DT（基线），作为一个基线模型的准确性和概念比较。为了最小化错误分类概率，使用Gini杂质标准。此外，根据训练集和测试集的ROC值下的最佳面积，参考文献[5]中的第二个基线模型NN_lifestyle（基线）使用多层感知器神经网络，其中使用欠采样技术平衡数据。该模型有一个隐藏层，与11个输入节点完全连接，用于各自的特征，如年龄，性别，教育，婚姻状况，收入，体重，身高，运动，糖尿病状况等。此外，他们在隐藏层和输出层使用Tanh我们仅将此模型用于精度比较来自参考文献[6]的最终基线模型CNN_other（基线）使用CNN框架使用八个生理变量预测高血压。他们将CNN的性能与其他机器学习模型进行了比较，如K-最近邻，随机森林，朴素贝叶斯，logistic等。在（a）中的第k个特征图的位置i、ji，j，k并将CNN确定为最大性能最好的模型，通过计算，Ya+1=Wl。Yl+bl+1）卷积层是精度CNN框架实现了三个卷积层，由三个池化层和一个全连接层分开。他们还发现ReLU激活函数的性能优于sigmoidi，j，kk i，j k和Tanh激活函数[6]。该模型在本文中用于其中，Wl是第l层上的第k个滤波器的权重向量，bl是第k个滤波器的权重向量。准确度比较而已。K K相应的偏置分量。在本文中，第一个卷积层（CONV 1）实现了48个滤波器;产生大小为（35，48）的特征图在转移到下一个卷积层（CONV2）之前，特征值被归一化而不改变映射的维度第二个卷积层实现ReLU激活函数，在CONV 1的输出上产生24个过滤器;产生大小为（32，24）的特征图从第二卷积层获得的特征值在馈送到池化层之前再次归一化[6，43，46]。在卷积层产生的特征图往往具有较高的维度，需要对重要信号进行概括池化3.3. 用于验证CNN学习的概念的统计方法在医疗保健研究中，统计分析被认为更可靠，因为它们的结果很容易解释。因此，我们使用卡方检验和比值比作为变量关联的基准。这些统计检验处理我们数据集中的分类和连续变量。地图Y3. 材料和方法医学博士Islam和R. Shamsuddin阵列12（2021）1000905=∈3.3.1. 卡方检验卡方检验是一种统计假设检验，用于确定两个（或多个）目标组之间变量的出现频率是否存在统计学显著差异，表112个二进制，4个连续（F1，F2，F6和F15）和6个分类生活方式变量的列表具有多个值。SI.变量描述SI.变量描述正常人和高血压患者的对比。如果两组显著不同，即变量值依赖于1家庭成员总数[F1]12住户有自行车[F12]-是或否目标组出现凹痕;相关p值将小于0.05错误率保持在最广泛使用的5%的值。由于卡方检验使用变量的频率计数，2答辩人的年龄[F2]13是否拥有土地[F13]3性别[F3]4地区[F4]使用分类变量。5自我报告的糖尿病状态[F5]16在房间里做饭[F16]-是或没有3.3.2. 比值比（OR）6身体质量指数（BMI）[F6]17婚姻状况[F17离婚/分居/丧偶比值比（OR）测量目标变量和感兴趣变量之间的关联程度，可以构建OR的95%置信区间（具有相关p值7家庭成员在屋内吸烟[F7][F17v2]或从未结婚[F17v3]18教育状况值，以获得重要性的间接证据。如果OR 1，则感兴趣的变量不影响目标变量（或结果的几率）;如果OR> 1，则感兴趣的变量与更高的结果的几率;否则，感兴趣的变量与8国家[F8]19受访者的职业-不工作[F19v1 ]、农业工作[F19v2 ]、非农业工作[F19v3 ]、家庭佣工[F19v4 ]或中高层工作降低结果的可能性。它可以通过逻辑回归获得的系数的指数来计算。此外，它可以用于分类和连续变量。9家庭有电[F9][F19v5]，其他[F19v6]20水源-其他经改善的饮用水源[F20v1]，室内自来水（经改善的水源）[F20v2]，未经改善的饮用水源3.4. 通过模拟算法来理解受训者所学的概念10家庭有收音机[F10]【F20v3】21地板材料–CNN为了探索CNN学习的概念，我们设计了一个训练CNN的数据扰动模拟，它学习一个类分布，是或否11家庭有冰箱[F11][F21v1]、泥土/沙子/粪便主体[F21v2]或木材/木板主体[F21v3]22屋顶材料bition。由于预期数据包含连续和分类变量，因此我们进行了两次模拟：i）用于评估分类特征的分类模拟，以及ii）用于评估连续特征的连续模拟。我们将一般患者实例表示为I（id，Xid，label），其中id是用于标识单个患者的正数，X是患者的所有特征的集合，并且label是患者的特征。关联的类标签。在两个模拟期间，每次迭代用t∈{1，2，.，T}表示，并且每个新创建的实例用I（id，F t，x '，label）表示，其中F是变化变量的集合，F t是在t期间考虑的特征/变量，F t F，F是X_id的子集，且x '是保持不变的变量。对于两种（连续和分类）模拟，每次迭代开始于一个随机选择的真实实例，I（id，Xid，label），来自真实数据，Xid包含属性信息和labelcon。木/板/石/锡原理[F22v3]算法：分类模拟。输入：数据集，n1，n2，CNN1) 随机选择n1个阳性患者实例（即高血压病例）和n2个阴性患者实例（即高血压病例）。非高血压病例）。2)对于每个选择的实例，I（id，Xid，label），a) 计算实例的基本概率，例如CNN（I（id，Xid，label））b) 将x '设置为X id中的连续变量。C）设F是所有T个分类变量的列表，其中每个变量取m不同的价值观.d）对于t∈{1，2，i. 将Ft设置为F中的第t个变量。ii. 对于k∈{1，- 创建实例，I（id，Ft=k，标签分类两个模拟都将Xid分为两个子集，F-找到概率，p=CNN（I（id，Ft=k，x '，~））;- 商店p.和X '。对于分类模拟，F等于所有分类变量的集合，x保持xF并创建多个新的人工实例I（id，Ft=k，是Ft的真实数据集中允许的任何可行值。~用于表示这个新实例没有被分配给任何类。如果Ft是分类的，并且有m个不同的标称值，那么k采用（m-1）个不同的标称值来创建（m-1）个新的人工实例。存在（m-1）个新实例，因为分类变量的至少一个名义值是真实数据的形式。如果Ft是连续的，那么k的值是从变量的估计分布导出的;分布被多次采样以创建多个新实例。然后，来自I（id，Xid，label）的新创建的实例通过训练的CNN，并记录CNN响应（类成员资格的概率）的变化。运行分类模拟的算法在图1中给出，分类模拟的样本输出可在表4中找到。连续模拟的输出示例见图6。两个模拟都使用相同的训练CNN运行。输出：每个I（id，F t= k，x '，~）获得高血压的概率（在t和k的所有值上），其对应于所创建实例的标签。对于连续模拟，假设每个连续变量遵循正态分布，并且在训练CNN模型和执行模拟之前相应地标准化。连续模拟的算法类似于算法1，但有以下变化：1) 相应的分类变量将保持不变（步骤1）并保持不变（步骤2b）2) F包含所有T个连续变量（步骤2c）。我们对2000名受试者（1000名高血压患者和1000名健康个体）和8名受试者（4名高血压患者和4名正常人）进行模拟，以分别从分类特征和连续特征中推断概念（结果见第4.2节，表4和图4）。（六）。3.5. 数据集描述该数据集是从两个国家的代表性，跨-医学博士Islam和R. Shamsuddin阵列12（2021）1000906≥≥-表2a来自具有类标签（“Hyp”）变量1至14的数据集的Si x样本。本表中使用的缩略语解释如下：“Mem“是家庭成员的数量，“Gen“是受试者的性别，“Area“是指受试者是否居住在农村或城市地区，“Diab“表示受试者是否患有糖尿病，“Hhsm“是指室内吸烟，“Coun“是受试者居住的国家，“Elec“表示受试者是否有电。“Rad”、“Refr”和“Cyc“分别指受试者是否拥有收音机、冰箱和/或自行车。HypMem年龄Gen区域DiabBMIHhsm库恩ElecRadRefrCYC土地列表065800021.101100011053610020.601000001025500017.101000001055510018.501100011054800026.801100011167000015.301100111表2b这是表2 - 1的延续，变量15至22的样本相同。“CRM“代表房间内的烹饪设施，“Mar“和“Edu“分别表示婚姻和教育状况。臂CRMMarEduOCC瓦苏地板屋顶260目前已婚没有c1_不工作其他改善饮酒泥土/沙子/粪便或其他木头/木板/石头/锡教育水源主楼层主顶板28 0目前已婚初级c4_家庭佣工其他改善饮酒水源泥土/沙子/粪便或其他作为主要地面木/板/石/锡主屋顶23 0已婚无学历c1_不工作其他改善饮酒水源泥土/沙子/粪便或其他作为主要地面木/板/石/锡主屋顶26 0目前已婚中学c5_midhi其他改善饮酒水源25 0目前已婚中学c1_不工作其他改善饮酒水源泥土/沙子/粪便或其他作为主要地面泥土/沙子/粪便或其他作为主要地面木/板/石/锡主屋顶220离婚/分居/没有c1_不工作其他改善饮酒泥土/沙子/粪便或其他木头/木板/石头/锡丧偶/丧偶教育水源主楼层主顶板分区健康调查孟加拉国的调查于2011年进行，这是孟加拉国第六次人口和健康调查，采用两阶段分层整群抽样方法。在农村和城市地区选择了约18，000个居民家庭，其中选择了合格样本的子集用于生物标志物组分，如血压、血糖、身高和体重测量。另一方面，在印度进行的第四次全国家庭健康调查（2015-16）也采用了两阶段分层整群抽样技术。选择受访者的方式，国家领土和地区的代表性，以及农村-城市一级的估计是有效的。共有699，686名符合条件的育龄女性和112，122名男性接受了采访，而选定数量的受访者提供了生物标志物成分。总体而言，两项调查均收集了受访者的背景信息、生殖、计划生育、妇幼健康、儿童营养、人体测量和生物标志物信息。患者收缩压140 mmHg，或舒张压90mmHg，或在调查时正在服用高血压药物的人被标记为高血压阳性[28[2，28，29，31]提出了相关变量，其详细信息见表1。在调查的所有受访者中，有226，953人因具有相关特征信息而被纳入本研究，其中194，728人血压正常（阴性），32，225人患有高血压（阳性）。在调查的所有受访者中，有226，953人因具有相关特征信息而被纳入本研究，其中194，728人血压正常（阴性），32，225人患有高血压（阳性）。表2a和2b显示了来自数据集的具有22个变量的SIX个样本预处理数据集：由于数据集是不平衡的（有16%的正实例），我们使用了随机过采样方法（使用Python的Scikit-learn库）来确保正确的训练。在训练之前，将连续特征转化为各自的图二. CNN模型的收敛曲线标准化的形式，所有的分类特征被二值化。例如，F6的范围为70.21（最小值：4.87，最大值：75.10），其标准值范围为17.12（最小值：4.11，最大值：13.00），而F16的值为0或1。4. 结果和讨论在本节中，我们介绍了CNN作为诊断工具的性能，并将其与从基线模型和文献模型中获得的准确性进行了比较。接下来，我们将比较CNN学习的概念与从统计测试中获得的相关性，在新的生活方式数据集上训练的决策树以及文献中发现的证据医学博士Islam和R. Shamsuddin阵列12（2021）1000907表3深度网络模型在训练和测试数据集上的性能。 AUC= ROC 曲线下面积。CNN_lifestyle、DT（baseline）和DT_distill是我们使用新的生活方式数据训练的模型。另外两款车型分别来自文学和生理数据的训练。作为损失最小化者，我们将其定义为CNN_lifestyle[24，32]。辍学率设定为20%。80%的数据集用于训练，其余用于测试。我们实现了决策树（DT）作为我们的基准模型之一，用于准确性和可解释性目的。文献模型被用作准确性和性能的基线模型模型精度（%）灵敏度（%）特异性（%）AUC（%）只有曼斯。在训练阶段不同时期的模型精度和损失如图所示。二、CNN_生活方式列车70. 0 71. 1 69. 0 77. 0测试68.4 69.0 68.4 74.4DT（基线）列车67.7 72.7 62.8 73.6测试64.4 73.7 62.8 73.9DT_distill列车88.3 84.1 92.6 94.4测试70.0 64.0 71.0 71.1我们实现了另一个最近提出的模型，该模型旨在保持深度学习的准确性，同时更容易解释[20]。这个模型，也被称为CNN的蒸馏到软决策树（DT_distill）模型。DT_distill也包含在我们的结果中以进行准确度比较。二叉软决策树在每个内部节点i中并入了学习的过滤器Fi和偏置bi，其中作为整体，它学习了NN_lifestyle（基线）72 46.7 85.4 77.0基于概率pi（X）=σ（XFi+）的具有分支判决的滤波器bi）;这里X是输入，σ是sigmoid logistic函数。每个CNN_other（基线）表490.0无报道未报告未报告样本被分配给与路径概率和可能输出类的学习分布相关的特定偏执者[20]。表3给出了CNN的四个评估指标的分类结果模型NN_lifestyle[5]和CNN_other[6]被用作其中两个模型基准模型从文献中评估我们的性能在所选数据实例上模拟分类特征特征特征值平均概率变化性别男性0. 056女性-0.055农村-0.001CNN_生活方式作为诊断模型。虽然NN_lifestyle似乎具有较高的预测高血压的准确性，但从表3可以看出，NN_lifestyle具有非常低的灵敏度。灵敏度低于50%意味着该模型不善于区分真阳性，并且具有大量的假阴性。仅高灵敏度就意味着NN_lifestyle糖尿病状态在屋内城市0.003否-0.067是0.065否-0.012是0.013我们只擅长识别正常实例;我们使用不平衡数据集（未在表3中列出）的模型得到了类似的结果。相比之下，我们的模型在检测高血压和正常情况方面更好。由于特异性/灵敏度未知，国家孟加拉国-0.012CNN_其他，我们不能提供类似的比较，但我们确实期望电冰箱循环土地印度0.042否-0.015是0.004否0.002是-0.010否0.007是-0.009否0.042是0.003否-0.005是0.004生理数据比生活方式选择与高血压有更直接的相关性。然而，在生理数据上训练的CNN不能用于生活方式选择方面的可行治疗计划，也不能向患者推荐药物。高血压的全面诊断模型需要生理和生活方式数据。然而，收集这些数据集需要巨大的努力和协调。CNN_lifestyle的表现略好于决策树模型。此外，CNN到软决策树的蒸馏表现出很高的牲畜编号-0.005训练性能，但测试灵敏度不令人满意（这在房间里做饭婚姻状况教育占领水源是0.001否0.017是-0.011已婚0.001离婚-0.003从未结婚-0.001未受教育小学0.009中学-0.010高于中学-0.009不工作0.017农业-0.017非农业-0.015家庭佣工-0.025中等偏高0.017其他0.006自来水0.007其他改善-0.004未改善0.001也可能是一个指标，表明该模型需要比目前可用的更多的数据来进行适当的训练）。因此，我们没有将蒸馏模型作为基线模型。4.2. 了解诊断模型4.2.1. 统计结果的判读结果为了比较CNN在高血压和特征之间学习相关性的性能，我们对数据集进行了统计分析。卡方检验用于检查每个特征与高血压的关联。所有特征的p值均小于0.01，表明它们都有助于高血压分类。我们还进行了一个简单的逻辑回归，以找到比值比[33]高血压，并评估统计学意义。总的来说，我们发现，男性，生活在城市地区，患有糖尿病，生活在地面材料水泥-0.009土/沙/粪0.009孟加拉国、具有电力及相关器具，具有没有或文化程度低，从事中高级工作，年龄大，屋顶材料木材/板材0.011水泥-0.015泥土/沙子/粪便-0.004木材/木板0.025高BMI和/或高臂围显著增加了患高血压的几率。更具体的结果见补充材料（表S1和S2）。4.1. CNN的诊断准确性CNN是使用Keras（Python 3.7）在TensorFlow中实现的，二进制交叉熵作为损失函数，Adam优化器4.2.2. 决策树的解释结果图3示出了描述高血压的分类流程的决策树图。首先，训练数据集的根节点是age（X1），它基于30岁创建了两个子集。对于年龄小于30岁的人，内部节点基于BMI（X5）将子集分为两个，区域医学博士Islam和R. Shamsuddin阵列12（2021）1000908=-=-图三. 高血压的决策树分类22.8，但对于30岁以上的人来说，BMI分界点是23.3。一个有趣的模式是，30岁以下且BMI为22.3或以上的男性（X2）受访者被确定为高血压，但相应的女性（X2）受访者血压正常。决策树算法还包括臂围（X14）作为22-30岁年龄组的内部节点的分裂规则4.2.3. 模拟结果的解释我们的输入域由两种类型的特征组成对各个特征进行分类和连续模拟的主要目的是量化高血压的概率贡献。对于分类模拟，我们一次改变一个类别，并比较概率贡献。对于连续模拟，将针对相应连续特征的有效域绘制概率。5. 分类模拟的结果通过将n1和n2设置为1000进行分类模拟。这相当于选择一千个高血压（阳性）实例和一千个正常（阴性）实例进行模拟，CNN模型准确分类比如说，设两个实例由I（1，Ft，x' = [年龄= 35岁，家庭成员= 4，BMI =20.28，臂围= 28 cm ]，label = 0）和I（2，F t，x ' = [年龄= 35岁，家庭成员= 4，BMI = 20.28，臂围= 28 cm ]，label = 1）表示为了简洁起见，我们将它们称为I（

下载后可阅读完整内容，剩余1页未读，立即下载