医疗记录的可视化分析方法

155 浏览量更新于2024-01-24 收藏 1.86MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

视觉信息学4（2020）72用序列嵌入评估医疗记录的比较视觉分析郭荣辰a，李俊，藤原孝则b，李怡然b，王建民. Limac，Soman Send，南湾陈c，马关柳ba北京航空航天大学计算机科学系，中国北京b美国加州大学戴维斯分校计算机科学系c美国加州大学戴维斯分校病理学和实验室医学系d美国加州大学戴维斯分校外科系ar t i cl e i nf o文章历史记录：2020年4月3日网上发售保留字：电子病历事件序列数据自动编码器自注意序列相似性可视化分析a b st ra ct用于数据驱动诊断的机器学习在医学中得到了积极的研究，以提供更好的医疗保健。支持与接受治疗的患者相似的患者队列的分析是临床医生以高置信度做出决策的关键任务。然而，这样的分析是不简单的，由于医疗记录的特点：高维，时间上的不规则性，稀疏性。为了解决这一问题，本文提出了一种病历相似度计算方法我们的方法采用事件和序列嵌入。当我们使用自动编码器进行事件嵌入时，我们将其变体与自注意机制一起应用于序列嵌入。此外，为了更好地处理数据的不规则性，我们加强了考虑不同时间间隔的自注意机制。我们已经开发了一个可视化分析系统，以支持患者记录的比较研究。为了更容易地比较具有不同长度的序列，我们的系统结合了序列比对方法。通过其交互式界面，用户可以快速识别感兴趣的患者，并方便地查看患者记录的时间和多变量方面。我们证明了我们的设计和系统的有效性，使用真实世界的数据集加州大学戴维斯分校的新生儿重症监护室的©2020作者（S）。由爱思唯尔公司出版我代表浙江大学和浙江大学出版社有限公司这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍使用存储为电子病历（EMR）的患者健康信息进行数据驱动的临床决策一直是一个研究领域，是实现精准医疗的途径（Yazhini和Loganathan，2019; Harerimana等人，2019年）。，2019）。EMR包含记录患者访问医院的时间序列数据。这些数据包括患者病史和诊断、实验室测试、药物、程序等（Lee et al. ，2017年）。使用最新的先进机器学习方法（特别是深度学习（DL）方法）分析EMR数据，有望提高临床决策的准确性和精确度。例如，基于DL的分析可以识别外科手术的未来风险（Kawaler etal. ，2012）、治疗期间患者健康状况的恶化（Koyner et al. ，2018），以及更多（Pham et al. ，2017; Huang et al. ，2019）。*通讯作者。电子邮件地址：gmail.com（R. Guo）。https://doi.org/10.1016/j.visinf.2020.04.001尽管有上述潜在的好处，但许多基于DL的EMR方法仅显示预测结果（例如，心力衰竭的预测（Nguyen et al. ，2016年），再次入院（Yadav等人，2016）和最佳诊断分配（Li et al. ，2019年），并且它们通常是黑盒模型（即，很难理解为什么模型会做出特定的预测）。当诊断和治疗患者时，访问关于具有与当前患者相似的医学状况的先前患者的信息将帮助临床医生做出更自信的决定以及他们的领域知识和过去的经验（Jin等人，2011）。，2019）。此外，回顾类似的医疗记录有助于临床医生更深入地了解某种疾病的进展模式（Zhu et al. ，2016年）。然而，由于电子病历数据的特点，识别和分析相似的医疗记录EMR通常是高维的（例如，许多不同的医学测试），不规则的（即，患者根据他们何时访问医院而具有不同的数据收集时间点和间隔），和稀疏（例如，在许多其他的医学测试中，一些患者仅进行特定的医学测试）（Lee等人，，2017年）。因此，为了识别相似的病历，我们需要一种相似度计算方法，2468- 502 X/©2020作者。由爱思唯尔公司出版代表浙江大学和浙江大学出版社。这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表视觉信息学期刊主页：www.elsevier.com/locate/visinfR. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）7273可以处理所有这些特性。此外，对于分析来说，对如此复杂的数据进行比较成为一项至关重要的任务。为了解决处理高维，不规则性和稀疏性的挑战，首先，我们已经开发了一种方法，用于识别类似的医疗记录与焦点病人耦合和扩展两个现有的嵌入方法。我们采用基于事件嵌入的自动编码器（Kramer，1991）来处理许多不同的事件类型（例如，每个患者在每次医院访问时的医学测试结果）作为更紧凑的矢量表示。然后，为了转换具有不同长度的记录（例如，不同的医院访问次数）到相同长度的向量，我们使用序列到序列学习（seq2seq）（Sutskever et al. ，2014），其使用多层长短期记忆（LSTM）模型（ Hochreiter 和 Schmid-huber ， 1997 ）。此外，当使用seq2seq时，我们的方法扩展了标准的自我注意机制（Lin et al. ，2017年）作为序列时间自注意，对病历中通过这些嵌入步骤，每个患者我们还开发了一个交互式可视化分析系统，以便于对类似的医疗记录进行比较研究。该系统通过采用动态时间扭曲（Yi et al. ，1998）基于对齐。此外，该系统还提供了旨在帮助发现临床进展中的显著变化的概述。此外，为了支持从稀疏数据集中找到进行过类似测试的患者使用这些功能和显示详细信息的链接视图，临床医生可以了解患者如何以及为什么相似，或者即使它们通常相似，哪些方面也不同。最后，我们证明了我们的设计和系统的有效性与案例研究使用的数据集从加州大学戴维斯分校的新生儿重症监护病房。2. 相关工作在本节中，我们调查了（1）医疗数据和类似数据记录的可视化分析和（2）测量医疗记录相似性的方法的相关工作。2.1. 医疗保健和类似数据记录认识到来自EMR和电子健康记录（EHR）的医疗保健数据的可用性日益增加，研究人员开发了各种可视化分析方法。这些方法集中于广泛的主题，例如临床决策支持系统（CDSS）（Jin etal. ，2019年; Berner和La Lande，2016年），用于医疗决策的可解释机器学习（Kwon et al. ，2018; Ji et al. ，2019; Ming et al. ，2019; Li et al. ，2017），和疾病内部进展的探索（Guo et al. ，2018; Kwon et al. ，2019）。在上述工作中，医疗数据的时间事件序列可视化与我们的工作密切相关。这些工作集中于通过将EMR/EHR数据总结为基于流的表示来揭示疾病进展的常见模式（Perer et al. ，2015; Monroe等人，2013）。此外，委员会认为，为了清楚地显示序列模式，Guo et al. （2017，2018）将序列分割为潜伏期，以推断疾病进展。此外， Monroe et al. （ 2013 ）和 Gotz 和 Stavropoulos（2014）突出了关键事件，通过过滤掉不重要的事件来降低视觉复杂性这些工作可以帮助临床医生了解某种疾病的转变模式。不是将时间事件序列分析为是的，其他的研究试图从序列中提取有意义的信息。例如，OutFlow（Wongsuphasawat和Gotz，2011年，2012年）在序列及其后续结果（例如，死亡或存活;更好或更差的状况）。CarePre（Jin et al. ，2019）预测下一个医疗事件（例如，潜在疾病患者可能已经）从该序列中获得，并提供交互式可视化以帮助理解与患者的历史医疗记录的预测此外，与我们的类似，为了满足临床医生当包括专注于更一般领域的应用程序时，有几个作品可视化了人们的类似历史记录，以帮助他们在生活中做出决定（例如，什么行动博士学生应该采取的是一个教授（杜等。，2016年）。例如，从多组记录中，EventAction（Du et al. ，2016）通过使用固定大小的滑动窗口来找到相似的子序列。然后，EventAction提供将当前用户的记录与和期望结果相关的子序列（例如，成为一名教授）与假设分析。在 Peerlett （ Du et al. ， 2017 ）和LikeMeDonuts（Du et al. ，2019），而不是完全自动选择类似的记录，杜等人。（2017，2019）提供了可以交互式更改的相似性标准的选择，他们用表格2017或朝阳图2019可视化了相似的记录。在上述已有的工作中，Du et al. （2016年，2017年，2019年），Jin等人。（2019年）在提供用于识别类似记录的可视化分析方法方面与我们的工作关系最密切。然而，这些作品（Du et al. ，2016年，2017年，2019年）没有专门针对医疗记录，其相似性计算没有考虑EMR的数据特征（即，不规则性和稀疏性）。另一方面，虽然CarePre（Jinet al. ，2019）是为医疗记录设计的，其相似度计算采用动态时间规整（DTW）。如第4节所述，使用DTW处理不规则性的能力有限另一个主要区别是，我们的可视化分析系统提供了有效的功能，专注于分析类似的医疗记录（参见第5节）。2.2. 病历的相似度计算在这里，我们描述了可以用于计算具有不同长度的时间序列的相似性的方法，包括医疗记录。这些方法可以分为两种不同的类型：使用动态编程的弹性措施和利用机器学习（ML）的方法第一类中的方法找到两个不同序列之间的最佳比对，并通过计算比对事件对之间的某个聚合距离来计算序列动态时间缠绕（ DTW ）（ Yiet al. ， 1998 ）、最长公共子序列（ LCSS ）（Vlachos et al. ，2002）、具有实惩罚的编辑距离（ERP）（Chen和Ng，2004）和基于实序列的编辑距离（EDR）（Chenet al. （2005年）都属于这一类。DTW将两个时间序列与最佳匹配进行对齐，并使用对齐序列的对距离之和来表示序列相似性。由于DTW易受噪声事件的影响（即，噪声可能导致两个相似序列之间的较大距离），采用LCSS和EDR通过跳过噪声事件来解决该问题虽然DTW、LCSS和EDR是非度量距离函数，但ERP旨在通过引入用于相似性计算的恒定参考事件来提供度量距离函数。然而，正如Ratanamahatana和Keogh（2005）中关于DTW的讨论74R. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）72ˆˆ为了解决上述问题，已经开发了基于ML的方法。大多数基于ML的方法利用seq2seq（Sutskeveret al. ，2014）作为其基础（Liet al. ，2018年）。seq2seq包含两大部分，即编码器和解码器。编码器使用一个递归神经网络（RNN）将输入序列s嵌入到固定大小的潜在向量v（Rumelhart et al. ，1986），然后解码器使用另一个RNN基于向量v生成目标时间序列s。Seq2Seq获得最佳表示（即，通过最小化输入s和输出s之间的误差来计算潜在向量v）。然后，利用每个输入序列的潜在向量，可以利用特定距离度量（例如，Euclidean或cosine距离）。然而，上述两种方法都只考虑序列中事件的顺序。例如，这些方法不考虑事件之间的时间间隔。不同病人的病历往往有不同的时间间隔。此外，一个患者的记录通常具有不同的时间间隔。另一个例子是，这些方法不考虑同一患者记录内的事件之间的相关性在不同时间发生的两个不同事件可能具有高相关性（例如，患者可能在一段时间后具有复发的症状）。基于这些观察，我们通过整合自注意机制（Lin et al. ，2017年），以更好地捕捉医疗记录3. 背景和分析目标本节描述了EMR数据和分析目标的特征，这些特征决定了我们的模型和可视化系统的要求。3.1. EMR数据如Lee et al. （2017），EMR数据的一般特征使数据分析具有挑战性。我们描述了我们在这项工作中解决的三个关键方面。高维EMR数据通常由大量医学特征组成，诸如多个血清钙浓度）、药物、诊断和程序。时间上的不规则性EMR数据的不规则性是由于每个患者的医疗特征仅在他们访问医院时被记录。因此，每个患者数据稀疏性EMR数据经常遭受高比例的缺失数据。这可能是由数据收集问题（即，患者仅因某些医疗考虑而被检查）或文件问题（即，机器故障或人为输入错误（Wells et al. ，2013）。除了高比例的缺失数据之外，数据稀疏性是EMR的另一个一般特征稀疏是不可避免的，因为大多数病人只去医院几次，他们通常只接受一小部分医疗检查和治疗。3.1.1. 我们研究中使用的数据描述我们研究中使用的数据集包含来自美国学术区域医疗中心的新生儿重症监护室（NICU）的854名新生儿他们的记录是在2015年和2016年收集的。每个新生儿的记录包括在他们多次住院和NICU住院期间进行的实验室检测结果。虽然记录了239种不同的医学测试，但每个新生儿在每次医院访问时都进行了这些医学测试的子集（45项医学测试平均）。因此，该数据也具有与EMR数据相同的一般特征（即，239维，不同的时间跨度和长度，以及高稀疏性）。我们使用这个数据集作为我们工作中EMR数据的但是，我们应该注意到，我们的模型和可视化分析系统也适用于其他EMR数据集。3.2. 目标分析任务我们工作的总体目标是支持SIM卡的分析-和病人的医疗记录一样如前所述，当临床医生为患者做出决定时，分析相似的记录尤为重要（Jin et al. ，2019）。在这个总体目标下，我们在下面设定了几个详细的分析目标T1：查找相似病历。我们需要支持的最基本的任务是找到类似的医疗记录。基于在用户选择的焦点患者的记录上，系统应该提供最相似的记录（例如，前3个相似记录）T2：在相似记录中查找（不查找）相似时间点。尽管焦点患者和相似患者的记录之间的总体相似性很高，但相似性可能随着其临床进展而变化。特别是，找到不同的时间点是重要的医疗决策。例如，病灶患者可能突然血压升高，无法使用用于治疗其他类似患者的特定药物进行治疗。T3：比较某个时间点的医学特征值。此任务是补充T2。如T2中的示例所述，用户希望了解患者在某些特定时间点相似或不同的原因。T4：了解相似记录医学特征值的总体趋势另一个重要的任务是，在相似的记录之间，在不同的时间点上，哪些医学特征通常是相似的，以及如何相似。例如，通过该任务，用户可以发现所有这些患者的淋巴细胞相对较高，而只有病灶患者在他/她的血液中具有低红细胞计数。T5：比较特定医疗特征在不同时间的值。一旦用户发现病灶患者具有不同的趋势（例如，低红细胞计数）到T3或T4时，用户会想要知道关于相应特征的更多细节（例如，患者的红细胞计数是否首先，在第4节中，我们介绍了一种计算病历相似度的方法，这是支持T1所必需的。然后，在第5节中，我们描述了支持上述所有任务的可视化分析系统。4. 基于序列嵌入的在这一节中，我们介绍了我们的方法，相似性计算的医疗记录具有不同的长度。我们的相似性计算流程的概述如图所示。1.一、我们使用两步嵌入将医疗记录转换为固定长度的向量。第一步是（1）事件嵌入，其中转换由多个医学特征值组成的R. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）7275≪=1122L（AL（AFig. 1. 相似度计算步骤概述。图二. 具有自注意机制的LSTM自动编码器的两种不同模型。橙色箭头表示我们在时间自我注意中加入转化为矢量然后，我们应用（2）序列嵌入，其中每个4.1. 数据预处理EMR数据通常具有高比例的缺失值和/或高稀疏性。因此，在应用嵌入之前，我们需要实现空值。我们采用均值插补（Rubin，1987），这是最广泛使用的方法。通过使用第4.2节中描述的嵌入从插补结果中学习低维潜在表示，可以缓和平均插补对医疗记录相似性计算的影响。然而，我们应该注意到，平均插补仍然可能带来低估变异性的问题在我们的例子中，这个问题导致我们的方法判断两个新生儿谁采取了一套完全不同的测试具有高度相似性的可能性。我们没有为这个问题设计一个复杂的算法，而是提供了一个基于测试相似性的交互式过滤界面，如5.2节所述。4.2. 事件嵌入对于第一个嵌入，我们使用基本的自动编码器（Kramer，1991），一个由三层组成的神经网络（即，输入层、隐藏层和输出层）。我们使用这种嵌入来压缩每个事件令D是存储在医疗记录中的医疗特征的数量。事件嵌入为每个事件产生D′（D′D每一步）。这本质上是一种类似于应用主成分分析（PCA）（Jolliffe，1986）的方法，用于减少特征的总数以避免作为自动编码器的最初目的（Kramer，1991），它对数据集执行非线性PCA。由于电子病历数据的高维性和复杂性，这种方法更适合于电子病历数据。例如，在EMR数据中，每个事件对应于一个患者的唯一医院访问，并且由多个医学测试结果组成。设eA为患者A的第i个事件，uA为隐向量iAiA′由多个嵌入的载体组成的序列，i的表示（ui的长度为D），τA是事件eA发生的时间现在，(1)转换成矢量。为了应对高i iA数据的维数和稀疏性（参见第3节），我们使用第一步是学习原始特征的低维潜在表示。第二步用于处理数据的不规则性。最后，在通过这两个步骤获得固定长度的向量之后，我们使用一定的距离度量（例如欧几里得距离）计算每对这些向量虽然现有的工作，分析医疗记录（郭等。，2018; Jin et al. ，2019）也将每个事件嵌入到一个潜在向量中，与我们的模型有两个主要区别首先，他们只处理医疗事件（例如，诊断胰岛素）而没有附加信息（例如，诊断出多少胰岛素这些信息对于分析许多医疗记录很重要例如，在我们的数据集中，虽然新生儿采取了子集，在每个记录时间的测试中，我们不仅应该考虑他们进行了哪些测试的信息（例如，测量血液中淋巴细胞的量），而且还包括测试的信息结果（例如，1,000个淋巴细胞/1µ l）。此外，Jin等人（2019）在事件嵌入后使用DTW计算了两个医疗记录的相似性，而不是通过我们的第二个嵌入步骤。如第2.2节所述，基于DP的距离测量（包括DTW）处理医疗记录不规则性的能力将患者A的序列转换为序列s，多事件向量s A= n（u A，τ A），（u A，τ A），. . . ，（u A，τ A）π，（ 1）其中L（A）是序列sA的长度。对于我们的新生儿医学测试记录数据集D239）。然后，通过嵌入这些事件，我们获得了大小为32的潜在向量（即， D′ = 32）。4.3. 序列嵌入对于第二个嵌入，我们使用seq2seq框架（Sutskever et al. ，2014年）。如第2.2节所述，seq2seq框架已经被开发用于从输入序列生成输出序列。例如，英语句子和翻译的法语句子可以分别是输入和输出序列。seq 2seq框架的一个主要优点是输入（和/或输出）序列可以具有任何不同的长度，因为它使用RNN作为编码器和解码器。具体来说，我们使用带有LSTM单元的RNN来处理长范围的时间依赖性。在接下来的描述中，我们将带有LSTM单元的seq2seq称为LSTM自动编码器。在我们的例子中，使用LSTM自动编码器，我们获得了从不同长度输入转换的固定长度的潜在向量（即，医疗记录）。76R. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）72⌊·⌋∑⃗⃗⟨⟩ˆ--ˆ∑⃗此外，我们将自我注意力机制（Bahdanau et al. ，2014; Lin etal. ，2017）到LSTM自动编码器中。已知自我注意机制用于改善seq2seq的学习性能（Bahdanau et al. ，2014年）。除了这个原因之外，更重要的是，我们利用自我注意机制来对事件之间的时间间隔和事件之间的相关性进行建模。为了实现这一点，我们通过提供基于时间间隔的注意力权重控制来增强自我注意力机制我们将这种增强的自我注意机制称为时间自我注意。4.3.1. 具有自注意机制的LSTM自动编码器在我们的时间自我注意之前，我们首先简要介绍了在时间自我注意中使用的原始自我注意机制。LSTM自动编码器（Bahdanau et al. 2014年），如图所示。2（a）.计算权重αt′，i.我们用τt和τi计算d t，i，当量（1）：d t，i= 0|τt− τi|（7）其中，是将实数值转换为整数的floor函数。为了控制时间间隔差的精度，单位dt，i（例如，秒、小时或天），这取决于医疗记录或分析目标的类型。与EQ。根据式（5）、（6）和（7），该模型可以考虑序列嵌入期间事件之间的时间间隔和/或时间相关性。最后，我们使用最后一个编码器的隐藏状态的输出模型的训练目标函数是最小化图2（a），U 为 {u1，u2，. . . ，uL}，U 为 {u1，u2，. . . ，uL}，并且输入和输出序列之间的误差为min<$U <$−U<$2。v分别表示输入序列、输出序列和嵌入序列。具体地，输入序列U是第一次嵌入后的医学时间序列u1，u2，. . . .，u L是不具有时间信息τ1，τ2，. . . ，τL;输出序列U是U的重构;嵌入序列v是我们想要获得的输入序列的固定长度向量表示为了预测输出的第t个向量u t，模型引用ut−1、LSTM自动编码器的第t个隐藏状态h t和固定长度的潜在向量c t ，称为上下文向量。与自我-注意力机制，ct 是用一系列“注释”计算的（Bahdanau et al. ，2014）h1，. . .，h L.每个注释hi是从输入序列U计算的隐藏状态，并且包含关于U的信息，其中强烈关注围绕ui的部分。ct可以被计算为注释序列hi的加权和：Lct=αt，ihi（2）i=1其中αt， i是注释hi的权重。具体来说，αt， i的计算公式如下：经验（bt）我们的模型与Bahdanau等人的原始模型有另一个不同之处。（2014年）。而Bahdanau et al. （2014）使用了双向RNN（Schuster and Paliwal，1997），我们使用单向LSTM来保持模型简单，并更快地计算结果。然而，这是一个微小的差异，如果需要的话，我们可以用双向RNN代替它。对于我们的数据集，通过本节中的序列嵌入步骤，我们将854个新生儿记录中的每一个4.4. 嵌入向量通过上述两个嵌入步骤，我们为每个患者的记录提供了一个固定长度的嵌入向量现在，我们可以计算基于这些向量的序列相似性与一定的距离度量，如欧几里德距离或余弦距离。对于我们的数据集，我们测试了欧几里得距离和余弦距离，结果性能相似;因此，我们在系统中简单地选择了欧几里得距离。4.5. 与动态时间规整的为了证明我们的计算方法的有效性αt，i=哪里Lk=1我exp（bt，k）（三）通过比较不同长度的医疗记录的相似性，我们将我们的方法与基线相似性度量进行了比较：动态时间规整（DTW）（Yi et al. ，1998年）。我们执行识别NICU数据集中相似记录的任务，bt，i=f（h<$ t−1，hi）.（四）这里，f（·）是一个从隐藏状态ht−1和注释hi生成b t，i的神经网络。从本质上讲，αt，i显示了模型应该对ui周围的信息付出多大的注意力预测第t个输出向量ut。参见（Bahdanau et al. ，2014），了解更多关于其模型的详细信息4.3.2. 时间自我注意图2（b）示出了具有时间自注意力的LSTM自动编码器。与Bahdanau等人的模型有一个根本区别。（2014）使用αt′，i而不是使用等式中的αt，i。（三）、我们的模型在考虑时间间隔的情况下计算权重αt′，i在第i个输入事件和第t个输出事件之间。也就是说，exp（b′t）第3.1.1节。具体来说，我们使用这两种方法来找到前3个相似的序列，以给定的局灶性新生儿。然后，我们直观地比较焦点和识别的类似记录，看看哪种方法提供更合理的结果。图3显示了两个不同局灶性新生儿（ID 80和ID 21）的结果。1因为NICU数据集是多变量数据由239个不同的医学测试组成，我们随机选择6个测试（钙、二氧化碳、氯化物、肌酐、血红蛋白和钾），而不是显示所有医学测试中的每一个的时间序列，以使得可以视觉上比较和描述结果的具体差异。图3，我们没有应用任何序列比对，以避免包括来自比对的影响。在图3a和b中，第一行和第二行分别显示了使用我们的模型和DTW的结果。αt′，i=哪里Lk=1我exp（b′t，k）（五）从这些结果可以看出，我们的方法一般选择与病灶新生儿具有相似值和模式的时间序列。例如，图中的钙。3（a），b′t，i=f（ht−1，hi，dt，i）.（六）、从Eqs之间的差异可以看出。（4）和（6），我们的模型使用第i个和第t个事件之间的时间间隔dt，i，当[1]我们在此仅介绍两个不同局灶性新生儿的结果。对所有新生儿记录执行相同的任务所有结果均与 Fig.3 可以在 https ： //drive 上找到。google.com/drive/folders/1ypDt00VJKZqvSgW8GFcHtZUjDfZcAagM? USP=共享。∑R. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）7277图三. 使用我们的方法（顶行）和DTW（底行）识别的前3名相似新生儿记录的比较。我们选择（a）ID 80和（b）ID 21作为两例局灶性新生儿。每列对应于从239个随机选择的6个不同测试项目中的每一个见图4。可视化分析系统的用户界面。该系统由多个视图组成。(a)以及（b）显示每个新生儿所进行的医学测试的相似性和测试值的记录。(c)描述了从（a）或（b）中选择的新生儿与前3名相似新生儿之间的测试记录差异随时间的变化。(d)可视化选定新生儿和前3名相似新生儿的统计概况。(e)提供在（c）段所选时间的所有医学测试结果或（f）。（f）示出了（d）或（e）中所选择的测试的值的时间变化最后，（g）列出所有医学测试名称。所有序列在开始和“峰”（即，比其它接近的时间步长更高的值）。另一个明显的例子可以在图1的血红蛋白中看到。第3（a）段。所有序列中的值都倾向于随着时间的推移而减小，但在中间有一些峰值。另一方面，在一项研究中，我们可以看到，DTW选择的相似序列倾向于短，不显示与局灶性新生儿相同的模式。例如，在图1的二氧化碳中，3（b），而震源序列的值略有增加，DTW选择两条短的递减线作为前2和前3相似序列。这可能发生，因为在相似性计算期间，DTW试图基于简单的动态规划来找到两个序列之间的最佳比对。那么，如果有许多时间步长78R. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）72=→→ → →→图五、使用我们的可视化分析系统的分析工作流程。与对应的对齐时间步长的相异性越小，总的相异性就越小。综上所述，上述结果显示了我们的方法与DTW相比这种优势来自于使用深度神经网络来捕捉序列的整体过渡和时间模式，而不仅仅是关注于比较单个事件对。5. 视觉分析系统我们提出了一个可视化分析系统，旨在支持第3.2节中描述的分析任务。我们首先描述了系统的概述与分析工作流程，然后详细介绍了系统的每个视图。我们使用我们的新生儿数据集，使系统描述更加具体。然而，该系统可以应用于其他数据集组成的多元值的每个事件。5.1. 系统概述和分析工作流程我们通过对图4中的分析工作流程的解释来描述图4中所示的可视化分析系统的概述。五、首先，用户（例如，临床医生）可以看到新生儿医学测试结果的相似性信息的概览（图11）。5A）。我们的系统提供了所有新生儿的两个概述：一个是基于记录期间进行的测试组合的新生儿相似性（图11）。另一个是基于测试值的新生儿相似性（图4 a）。4b）。然后，通过参考这些视图，用户选择一个焦点新生儿。例如图在图4a中，从橙色集群中选择用黑色外环突出显示的新生儿。基于焦点新生儿，系统自动选择前k个相似的新生儿（具体地，k 3作为默认值），然后可视化焦点和前k个新生儿的概览，如图所示。 4 C和图。 4 d（对应图1）5B和D）。由于医疗记录可以表示为时间多变量事件序列，为了帮助用户确定时间步长，或一个变量进行审查，在图。 4 C和图。4D，我们分别从时间和变量方面更具体地，虽然图4c示出了前k名新生儿的测试结果与焦点新生儿的差异的时间变化，4D可视化了在记录的时间段内每个测试值的统计摘要。当用户想要基于时间变化详细查看测试值时，用户可以从图1的视图中选择一个时间步。4杯例如图4c，选择最后一个时间步，因为相异度变高。然后，为了查看它们相似（不相似）的原因，系统显示每个新生儿在所选时间的所有测试值，如图4 e所示（对应于图4 e）。5C）。此外，从图中所示的结果。4e，用户可以选择他/她想要的特定测试项目，来观察时间变化的细节例如图4 e，我们选择测试项目“12：100”，因为其值在病灶新生儿和其他新生儿之间具有最大差异。结果如图所示。 4 f（对应图）5E）。例如，从图4f，用户可以理解焦点新生儿在最后一个时间步的高“峰值”已经增加了图4f中观察到的相异性。 4杯另一方面，当用户开始从图1中可视化的变量的概述中查看细节时，在图4d（对应于图5D）中，用户可以从图4d中的结果中选择感兴趣的测试项目。 4 d和细节将显示在图。 4楼虽然我们已经描述了上面的两个主要分析流程，但图5A B C E（侧重于时间变化）和AD E（关注测试项目之间的差异），这些分析步骤中的每一个都是紧密相连的，在实践中，我们经常在这些不同的步骤中来回走。另外，我们要注意的是，我们系统中视图的排列是为了匹配两个主要分析流的顺序而5.2. 测试的相似性（图）。 4 a）图中的视图。 4a和图4b用于执行第3.2节中的T1，我们的相似性计算在第4节中描述。如前所述，EMR数据，包括我们的新生儿数据集，通常是稀疏的。我们已经在一定程度上解决了这个问题，使用两步嵌入的相似度计算。然而，由于数据预处理步骤中的平均插补，如第4.1节所述，我们的方法仍然可以判断两个新生儿谁采取了一个非常不同的测试集具有高度相似性。图4a可以用来处理这个问题。在这个视图中，我们根据新生儿在收集的时间段内进行的测试项目可视化新生儿记录的相似性。首先，我们使用 Jaccard 指数（Gower和Warrens，2017）来计算相似性。然后，为了在单个2D图中可视化所有新生儿之后，为了从DR结果中提取聚类，我们使用HDBSCAN（Campello et al. ，2013），基于密度的聚类方法之一。最后，为了告知聚类信息，我们对每个点进行着色（即，每个新生儿的记录）。我们使用具有足够色调差异的分类颜色来区分每个聚类。此外，因为基于密度的聚类（包括HDBSCAN）不会分配一些点（例如，离群值或噪声）到任何特定的聚类，我们用灰色将这些点着色并将其标记为用户可以从放置在左上方的输入对话框中选择焦点新生儿（例如，ID 175在图中被选择。4a）或单击视图中的某个点。我们用黑色外圈表示局灶性新生儿，如图4a所示。然后，系统根据第4节中描述的方法预先计算的相似性自动搜索前3个相似新生儿选择的前3名新生儿用具有不同饱和度的蓝色外环指示。较深的蓝色表示具有较高相似性的新生儿。我们选择了这种单一色调编码，以确保这些颜色不与集群颜色共享相同的色调，以避免误导用户。从图4a的示例中，我们可以看到，虽然焦点新生儿以及第一顶部新生儿和第二顶部新生儿是从橙色集群中选择的（即，集群A），第三个顶部新生儿选自紫色集群（即，组群D）。这是一个由平均值估算引起的问题的例子。在这种情况下，用户可能希望仅在橙色集群内选择相似的新生儿。为了支持这样的选择，我们提供了一个相互作用，以限制识别相似的新生儿只在选定的集群。交互结果的示例如图所示。六、首先，用户可以从R. Guo，T.Fujiwara，Y.Li等人/视觉信息学4（2020）7279见图6。在指定集群内选择相似的新生儿。放置在视图底部的簇。在图6a1中，鼠标悬停的集群用圆圈中心的点指示（类似于常用单选按钮的设计）。然后，用户可以通过鼠标点击来选择集群。如果焦点患者属于所选聚类，则系统立即选择并更新仅在所选聚类内的相似新生儿，如图6b1所示。此外，系统通过降低其他聚类的不透明度来突出显示所选聚类。还有，我们允许用户在集群选择之后更新焦点新生儿。在这种情况下，系统选择所选集群内的相似新生儿。用户可以通过再次单击所选群集来5.3. 总体测试记录的相似性（图4 b）此视图显示所有新生儿测试记录的相似性的概述。我们计算每一对的相似度使用第4节中描述的方法检查测试记录。类似于图。4a，我们应用t-SNE来可视化这些相似关系。通过提供该概述，用户可以找到其中所有新生儿具有相似测试值的特定组（即，识别新生儿群组）或来自其他新生儿的离群值例如，在图6a2中，我们可以看到三个新生儿被放置在远离其他新生儿的地方，如蓝绿色箭头所示我们基于图4a中所示的相应聚类对每个点进行着色，以提供视图之间的更好链接。如图7，有了这些颜色，我们可以看到新生儿倾向于聚集在一起，根据他们采取的测试，除了集群D（紫色）和E（棕色）。此视图支持图1中实现的相同交互。4a，如新生儿和聚类选择。还图4a和图4b中的视图例如，如图6所示，当在所进行的测试的相似性视图中更新选择时，整体测试记录的相似性视图将相应地更新，反之亦然。5.4. 测试记录的不一致性的转换（图 4 c）图1中测试记录不一致性的转换。图4C示出了焦点新生儿及其前3个相似记录的总体（不）相似性进展。该视图帮助用户理解前3个相似记录如何与焦点记录相似，以及它们何时最相似或不太相似（即，第3.2节中的T2）。为了显示上述信息，我们需要计算这些新生儿在每个时间步的测试结果的相似性。一个可能的选择是在4.3节中的序列嵌入之后使用向量表示。然而，在这种情况下，具有不同长度的时间步长已经被嵌入到相同长度的向量中。结果，难以从结果中选择执行随后的任务所必需的特定T3和T5）。相反，我们在事件嵌入之后使用向量表示（即，第一步嵌入）第4.2节。然而，由于所选择的新生儿的记录可能具有不同的时间步长长度，我们不能直接计算每个时间步长的相似度。因此，与Jin et al. （2019），适用DTW（Yi et al. ，1998）到事件嵌入后的向量，我们首先将焦点和前3个相似记录与具有最长时间步长的记录对齐。然后，在对齐的基础上，我们计算每个时间步的前3个相似记录的事件向量与焦点记录的相似度。注意，虽然Jin et al. （2019）使用DTW计算所有时间步长记录的相似性，我们仅使用DTW对齐两个不同长度的向量进行视觉比较。为了保持可视化的简单性，我们使用一个折线图来显示测试记录的差异的计算转换，如图2所示。4杯x坐标和y坐标分别表示时间步长和计算的相异度。对应于前3名新生儿中的一个的每个环都用图1中用于外环的相同方案着色。 4a和图 4b（例如，最暗的蓝色表示最相似的新生儿）。一个可视化的例子如图4c所示。在图4c中，我们可以看到，所有前3名新生儿在时间步长上保持相对较小的差异（约0.2或更小）。这表明我们在第4节中描述的相似性计算似乎可以正确识别相似的新生儿记录。另一方面，我们也可以看到，在时间步长7之后，差异明显增加。此外，虽然我们将范围为0-1的y坐标显示为默认情况下，系统允许用户通过单击位于y轴顶部的“缩放”按钮将缩放切换到从0到最大相异度最后，用户可以通过鼠标点击选择感兴趣的时间步长。所选择的时间步长用黑色虚线指示（例如，图4c）中的时间步长9。正如我们在5.6节中所描述的，图4e中的视图将根据所选时间进行更新。5.5. 测试记录概述（图4 d）此视图显示的是局灶性和前3名相似新生儿。更具体地说，对于每个新生儿，我们将

下载后可阅读完整内容，剩余1页未读，立即下载