没有合适的资源?快使用搜索试试~ 我知道了~
手术时间预测的简单模型及其在手术室调度中的应用
医学信息学解锁25(2021)100633一个简单的模型预测手术时间的评价外科手术参数Deny Ratna Yuniarthaa,b,*,Nur Aini Masruroha,Muhammad Kusumawan Herliansyah aa印度尼西亚日惹加达大学工程学院机械和工业工程系,邮编:55284b印度尼西亚日惹Atma Jaya Yogyak大学工业技术学院工业工程系,55281A R T I C L EI N FO保留字:手术持续时间手术程序手术计费预测机器学习A B S T R A C T手术时间的预测是手术室调度的主要数据。 外科学持续时间预测主要解决了大量预测器。然而,预测因子的可用数据是有限的或不易获得。在实践中,当外科医生保留手术时间表时,患者的身 份和手 术程序 名称肯定 是可用 的。其他详细数据将只提供在手术前几个小时对患者进行临床观察后。此外,手术持续时间的可变性导致手术室调度的复杂性。本研究评估了一个简单的模型来预测手术时间。该模型使用较少的预测因子,即手术参数,并降低了手术持续时间数值的变异性。这些参数包括为手术计费而收集的一组医院参数,代表手术复杂性和所需资源。使用估计算法,我们的结果表明,一组外科手术参数作为唯一的预测因子,其性能略优于将其与患者特征相结合。为了减少手术持续时间数值的变异性,我们使用离散化将其转换为由时间箱表示的分类值。我们提出了一种基于估计算法的平均绝对误差(MAE)的误差和准确度的改进计算方法,以评估使用分类值预测手术持续时间的分类算法。我们的研究表明,使用分类值的性能等同于使用数值。我们的简单模型可以帮助医院开发一个框架,用于预测手术时间使用有限的数据可用于手术计费。将在进一步研究中考虑使用预测手术持续时间分类值的手术室调度对手术室中患者等待时间和资源利用1. 介绍手术是医院提供的一项复杂服务,需要具备不同类型医疗专业知识、工具和设备的人力资源。此外,这些资源涉及高额投资和运营成本。因此,手术室的规划和调度是一项重要的活动,有助于提高其效率并提高服务质量,不仅在向患者提供治疗方面,而且在患者接受治疗的等待时间方面。手术室调度需要持续时间的数据手术的细节然而,手术持续时间是一个不确定的因素,除了病人的病情。调度程序通常使用外科医生预测,但这种预测不一定准确[1]。预计手术持续时间将短于实际持续时间在资源的空闲时间。相比之下,比实际持续时间更长的预测手术持续时间将导致更长的患者等待时间和随时间增加的资源。许多研究讨论了手术持续时间的预测。主要讨论了手术持续时间预测的方法患者和临床特征是手术持续时间的最常用预测因素。Schneider等人[2]提出了一种估计腹腔镜胆囊切除术持续时间的算法。该算法使用了患者性别、体重指数(BMI)和既往手术的临床评估。由于医务人员的可变性,他们还考虑将外科医生的经验作为基于所进行的外科手术数量的预测因素。结果报告了使用患者的预测误差的改善* 通讯作者。印度尼西亚日惹加达大学工程学院机械与工业工程系,邮编55284电子邮件地址:deny. uajy.ac.id(D.R.Yuniartha),aini@ugm.ac.id(N.A.Masruroh),herliansyah@ugm.ac.id(M.K. Herliansyah)。https://doi.org/10.1016/j.imu.2021.100633接收日期:2021年3月22日;接收日期:2021年5月27日;接受日期:2021年6月4日2021年6月13日在线提供2352-9148/©2021的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页:www.elsevier.com/locate/imuD.R. Yuniartha等人医学信息学解锁25(2021)1006332因素、诊断成像和外科医生经验。Devi等人[3]开发了眼科手术持续时间的预测模型。除患者年龄、患者前提条件和麻醉外,他们还利用医务人员经验(麻醉师、外科医生和护士)作为手术持续时间预测因子。考虑的患者前提条件是糖尿病、高血压和眼部感染,这将需要不同类型的麻醉并影响手术持续时间。与使用手术类型的平均手术持续时间进行预测相比,多专科外科的研究对象涉及众多的外科手术。Hosseini等人[4]提出了一种手术持续时间预测的混合方法,以处理众多外科手术的困难。该方法包括两个步骤:(1)分类,以减少外科手术代码和(2)预测手术时间。他们还评估了患者特征的影响,例如年龄、基于入院的等级、基于手术病例的优先级以及美国麻醉医师协会(ASA)的评分等级,用于术前评估患者的身体状况。他们建议更多的临床因素,特别是专业特异性因素,以提高预测。因此,一些研究开发了一种手术持续时间预测模型,该模型保留了外科医生的估计以及患者和临床因素[5类似于Ref。[4]他们还使用了一种外科手术程序以不同的形式。Eijkemans等人[5]使用了单独手术的数量,而Elderman等人[6]使用了医院手术代码。此外,Master等人[7]采用手术位置(手术室编号)来表示手术程序的复杂性。关于患者特征,Eijkemans等人[5]考虑了更完整的预测因素,即年龄、性别、BMI、既往入院史和心血管风险因素。患者风险因素与患者严重程度和手术并发症有关,这也影响手术持续时间。由于该模型是基于外科医生估计的,因此需要考虑外科医生特征的可变性。Eijkemans等人[5]使用外科医生的年龄和数量来完成具有外科医生团队经验的预测因素。 Master等人[7]考虑了使用主刀医生身份的个体外科医生的可变性。预测评估显示,手术操作和外科医生特征是重要因素[5,7]。他们的研究结果表明,患者特征具有适度的影响[5]。 此外,包括患者年龄在前,言语模型并没有显著提高性能[6]。然而,患者体重是儿科手术的重要预测因素[7]。同时,一些关于手术时间预测的研究通过涉及患者和临床因素之外的更广泛因素(如手术时间表因素)来改善预测。 Wang等人[8]研究了调度决策对手术持续时间的影响。他们的研究结果表明,外科医生的工作量,手术室的工作量,以及外科医生在一天内进行的手术序列中的手术位置都会影响手术持续时间。Gomes等人[9]开发了一种预测模型,该模型还考虑了进行手术的时间(月、周、日和班次)作为预测因素。他们的研究结果表明,患者,临床和调度因素改善了预与外科医生的估计相比,发音性能。此外,委员会认为,Kayıs等人。[10]表明,关于操作和时间因素的调度决策可以改善预测。手术因素是分配到手术室的手术,决定了手术顺序和手术室分配。时间因素是手术的日、月、年和时间。这两个因素与团队经验因素相结合,提高了预测准确性[11]。ShahabiKargar等人[12]还报告了通过使用更完整的预测因子(患者特征、临床因素、团队和手术时间安排决策因素)来改善整体外科专业的预测。然而,预测性能在专业水平上差异很大,某些专业导致更高的预测性能。预测误差[13]。使用类似的预测因子,Ng等人[14]确定外科手术代码是所有测试模型的最重要预测因子。使用大量预测因子的手术预测模型是一个复杂的问题,因为数据在实践中不容易获得[15],特别是患者数据,这些数据是保密的,只能由指定的官员访问。因此,一些关于手术持续时间预测的研究讨论了使用较少预测因子的预测模型,排除了患者因素。Stepaniak等人[16]开发了一种仅基于外科医生相关因素的预测模型。结果表明,最重要的因素取决于所使用的外科手术的类型。最常发现的重要因素是团队组成、经验和进行手术的班次Riekert等人[15]使用了外科手术代码、手术时间和手术位置(代表外科手术的复杂性)。他们发现,外科手术代码是最具决定性的预测因素。此外,Li等人[17]明确仅使用了外科手术代码,并降低了预测误差。Zhang和Zhang[18]建立了一种基于马尔可夫链模型估计手术持续时间的方法。所开发的方法模拟手术室内的手术阶段。考虑的因素包括外科医生、助手、麻醉师和手术室。然而,他们的研究的主要缺点是,它需要一个实证研究来验证估计手术时间的准确性。如前所述,这些研究讨论了手术持续时间的离线预测方法。相反,Spangenberg等人[19]开发了一种用于正在进行的手术的在线预测方法。该方法使用手术阶段、手术代码、手术室和时间跨度(从手术开始到当前阶段的时间段)预测剩余手术时间。对模型的评价表明,预测误差有所改善。手术时间预测是资源管理的基础,手术室的时间安排。该预测大多在手术前一天进行,而在一些医院可用的数据非常有限。我们在印度尼西亚日惹的两家医院的初步观察表明,外科医生至少在前一天下午保留了择期患者的手术时间表。外科医生预约还包括可能导致手术并发症的手术医生姓名、患者身份(年龄和性别)和患者前提条件等信息。调度员,即夜班的指定护士,将根据预约信息和每月护士时间表将手术和护士分配到每日手术室时间表。护士分配必须符合一特别 护士的手术程序能力要求。有时,当在保留时间内可用的护士不符合能力要求时,需要调整护士时间表。调度员根据他的/她的经验或外科医生的估计。我们最初的观察显示用于预测和调度的可用数据是外科手术名称、外科医生和患者身份。详细观察病人的预处理将在手术前几个然而,医院已经确定了用于计费目的的外科手术参数,这些参数代表了手术的复杂性和所需的资源。考虑的参数在医院之间略有不同,因为它们有不同的运营和行政政策。考虑到医院中可用和可访问的数据有限,在本研究中,我们研究了预测手术持续时间的简单模型的性能。我们提出的模型是一个简单的模型,因为它只利用一组手术参数作为主要预测因子,而不结合患者特征。我们对已经描述的先前研究的调查表明,外科手术是最常用和最有希望的手术时间预测因子。此外,手术持续时间指示手术室资源利用率,并且还与资源成本相关。通过使用用于外科手术计费的外科手术参数的集合,我们有机会将外科手术持续时间预测和外科手术参数组合在一起。D.R. Yuniartha等人医学信息学解锁25(2021)1006333++医院标准化用于计算手术成本。同时,已经研究了用于开发手术预测模型的各种方法。Stepaniak等人。[16]建立了一个基于对数正态分布的模型。Zhang和Zhang [18]开发了一种基于马尔可夫链模型的预测模型,使用指数分布对每个手术阶段的处理时间进行建模。为了避免基于分布的方法中的假设,一些开发的预测模型已经应用了基于回归的模型[2,5,6,8,10,11,17]和数据挖掘(或机器学习)技术[3,4,7,9,12Zhao等人。[20]报告了机器学习方法的优势,以提高机器人辅助手术预测病例持续时间的准确性。有两种机器学习方法用于预测任务:用于预测数值的估计算法和用于分类值的分类算法然而,由于手术持续时间是一个连续的数值,大多数用于预测手术持续时间的机器学习技术都是估计算法。据我们所知,使用分类算法进行手术持续时间预测的研究有限。Markazi-Moghran等人[21]应用分类算法评估手术室中的患者流量患者流显示了患者在手术室中通过手术阶段的移动他们使用总住院时间作为患者流量指标。这是从到达手术室到恢复结束的时间间隔手术持续时间,即从患者到达手术室到进入恢复室的时间间隔,是总住院时间的一部分使用分组和k均值聚类将总住院时间离散化为低、中或高类别。分类器将患者分类为低、中或高住院时间,以便于识别可能长期住院的患者Zabardast [22]开发了一个手术持续时间预测模型,估计和分类算法。对于分类算法,将手术持续时间离散化到时间箱中。bin指示手术持续时间的时间跨度。分类器预测代表手术持续时间分类值的箱。分类算法的预测误差是实际手术持续时间数值与预测区间中点之间的差值。根据误差和阈值确定预测精度。他们的结果表明,分类算法优于估计算法。在本研究中,我们使用数据挖掘技术,即参考文献[22]中描述的估计和分类算法,使用一组外科手术参数预测手术持续时间。即使对于相同的外科手术类型,实际手术持续时间数值也可能不同。我们还将手术持续时间数值离散化为手术持续时间类别。手术持续时间类别表示手术持续时间跨度。手术持续时间数值在时间跨度内的手术病例将属于同一手术持续时间类别。我们假设得出的手术持续时间类别可以适应不同的手术持续时间数值[22]。因此,我们建议使用时间跨度的中点或模式来表示手术持续时间的类别。使用单个数值降低了时间跨度(手术持续时间的一种类别)内手术持续时间数值的可变性。因此,本研究的主要贡献是预测手术持续时间的简单模型,该模型使用较少的预测因子,并使用分类值降低手术持续时间的变异性。本文的其余部分组织如下。第2节描述了本研究中使用的数据和方法。第三部分给出了两所医院数据的数值实验。在第4节中,我们讨论了与手术持续时间相关的现有研究结果预测. 第5节提出了结论和潜在的方向为未来的工作。2. 材料和方法2.1. 数据在这项研究中,我们使用了来自印度尼西亚日惹市两家中级医院的数据。两家医院在经营和管理政策方面存在差异。因此,我们将这两种医院标记为A和B。我们使用相同的方法对医院进行了单独的分析,发现了类似的发现。医院A已经有了数字化的手术报告的记录,包括患者身份、手术过程、外科医生姓名、护士B医院仅以数字方式记录患者身份、手术程序、外科医生姓名、手术室号、进入时间和离开时间手术室然而,每个手术的详细信息阶段,包括开始时间和护士分配,手动记录在病人的医疗记录中。我们的研究重点是手术持续时间,即从进入手术室到到达恢复室的持续时间。 因此我们提取可用时间数据以确定手术持续时间。我们也使用病人的先决条件,病人的心理状态,和护士能力的数据,比较预测性能。对于这两家医院,我们从页面的手动表格中提取了患者数据,蒂恩特的医疗记录我们还将护士的姓名转换为各自的能力级别。2.2. 数据预处理数据挖掘的第一步是数据预处理。我们进行了几个数据预处理任务:数据清洗,数据转换,特征提取(特征构造),离群点检测和离散化。在数据挖掘中,通常用于预测的术语是特征。因此,在本文的其余部分,我们使用术语特征而不是预测器。在数据清洗中,我们识别了缺失值特征并纠正了特征值的非标准写入。省略至少有一个空特征的手术病例(在下一步中不考虑)。我们进行了数据转换,将患者年龄的数值转换为6个类别的分类值,将序数或名义值转换为二进制或整数值。特征提取(特征构造)是一种通过在现有特征的基础上添加新特征来减少数据的技术[23]。在我们的初始数据中,多达14种疾病被视为患者合并症。我们将这些疾病分为两个特征:合并症和其他疾病。特征合并症代表以术前观察形式列出的患者风险因素总数,而其他疾病代表未在表格中列出的患者风险因素总数。相同的机制被应用于具有不同表征的特征过敏和心理状态。表1总结了两个数据集的特征由于我们的手术持续时间数据最初包括数值,因此有必要使用分类算法将其转换为分类值进行预测我们使用等宽分箱、k均值聚类和层次聚类将手术持续时间数值离散化为时间跨度。每个时间跨度代表手术持续时间的类别值。为了简化数值实验中的术语,我们使用术语bin来表示时间跨度。我们在Or- ange 3.24.1版中使用了相关的小部件(离散化、k-means、层次聚类)k-means聚类的初始化方法有随机初始化和k-means初始化。当应用聚类时,我们同时检测离群值[23]。2.3. 模型研究的框架如图1所示。本研究的目的之一是调查医院的外科手术参数是否可以 用作 主要 特征 ,D.R. Yuniartha等人医学信息学解锁25(2021)1006334表1功能摘要特征类型类别数量医院A医院B在预处理阶段,我们通过识别显著特征来开始预测。我们使用Orange版本3.24.1中的排名小部件,根据与目标变量(手术持续时间)的相关性对特征进行评分。手术持续时间是一个数字值 因此,我们评估了fea的预测性能,患者切口分类N/A 2急性分类N/A 2团队外科医生分类13 41使用估计算法在排名列表中搜索结果。我们通过减少预测算法中使用的特征数量来识别重要特征,从排名最低的特征开始。我们使用两种特征组合的场景进一步检查了预测性能。第一种情况涉及仅结合外科手术参数。第二种情况涉及外科手术参数与已识别的显著特征相结合。我们使用估计算法从两种情况下的特征组合中确定了最佳手术持续时间预测,从而获得最佳预测性能。我们使用手术持续时间分类值进行预测,以适应手术持续时间数值的变异性。在预处理阶段,我们使用离散化技术将手术持续时间数值转换为时间箱。时间箱代表手术持续时间分类值。对于所有使用的离散化技术,我们将箱的数量从3到10不等。对于相同数量的箱,离散化技术可以导致不同的时间跨度的极限点。因此,我们进行了进一步的分析,以确定预测的箱数。我们应用分类算法来分析手术持续时间分类值的预测。分类算法中使用的特征是导致估计算法的最佳预测的特征组合。我们研究的第二个目的是调查使用分类值进行手术持续时间预测,Fig. 1. 拟议模式的框架。年龄分类66性分类22录取分类N/A2共病数值--其他疾病数值--过敏分类33吸烟者分类22饮酒者分类22心理状况分类22手术史分类22输血史分类22外科手术专业分类712麻醉分类38分类55污染分类3N/A麻醉师分类29助理护士能力分类33仪器护士能力分类33循环护士能力分类33麻醉护士能力分类33D.R. Yuniartha等人医学信息学解锁25(2021)1006335使用分类算法确定数值的可变性。因此,我们通过将分类算法与估计算法进行比较来评估分类算法的预测性能。 然而,这两种算法具有不同的目标变量和预测性能测量。该估计算法用于具有数值的目标变量。它使用平均绝对误差(MAE)或均方根误差(RMSE)作为性能度量。分类算法用于分类目标变量,准确度,精度和F1得分作为性能指标。我们将估计算法应用于手术持续时间数值,并使用平均绝对误差(MAE)评估预测性能。此外,我们使用分类算法预测的手术持续时间分类值的预测准确度。为了比较两种算法的预测性能,这是不同的目标变量,我们需要修改的计算误差和准确度。我们将误差计算应用于参考文献[22]中的分类算法。误差是手术持续时间的实际值与预测区间中点之间的差值,预测区间中点代表预测的手术持续时间分类值。我们的手术持续时间数据是从手术报告数据,记录每个手术过程阶段。我们将时间数据转换为以分钟为单位的持续时间。因此,我们将手术持续时间数据作为整数值。我们数据集的手术持续时间分布数据显示,几个值的频率高于相邻值。因此,我们还提出了一个错误的计算的分类算法使用的模式的预测箱。这是手术持续时间的实际值与预测bin模式之间的差异,称为修正误差。Zabardast [22]根据误差和预定阈值计算预测精度。如果误差小于或等于阈值,则预测准确。考虑到我们的研究目的是比较手术针对时长预测性能的估计和分类算法,提出了以估计算法产生的MAE作为阈值。对于估计算法,如果预测误差小于或等于MAE,则预测是准确的。对于分类算法,如果修改后的预处理结果是正确的,则预测是准确的检测误差(基于面元到MAE。我们将这种确定精度的方法命名为修正精度。在我们的研究中,我们使用Orange 3.24.1版本进行所有数据挖掘技术。3. 结果3.1. 利用估计算法我们通过识别显著特征开始预测手术持续时间数值。我们在Orange3.24.1版本中使用了四种特征评分方法:ReliefF、线性回归(LR)、随机森林(RF)和随机梯度下降(SGD)。这四种方法导致不同的顺序的功能排名。因此,我们使用四种方法的排名中的所有特征来检查估计算法的预测性能。我们通过减少预测算法中使用的特征数量来识别重要特征 , 从 排 名 最 低 的 特 征 开 始 。 本 研 究 中 的 估 计 算 法 有 k- 最 近 邻(kNN)、树、支持向量机(SVM)、SGD、RF、神经网络、LR和AdaBoost。我们在Orange 3.24.1版本中使用交叉验证来选择最佳算法。我们评估了每种评分方法和特征数量的所有估计算法的预测性能。图2示出了与特征的数量图 2表明,MAE是收敛的四种评分方法在达到一定数量的特征之后。当医院A数据集的特征数量为13个,医院B数据集的特征数量为12个时,MAE收敛是图二、每种特征评分方法的最佳MAE(分钟)。当外科手术类别特征被包括在预测模型中时获得。相反,图2还显示,当不包括外科手术类别特征时,估计值导致较高的MAE值。因此,可以得出结论,外科手术类别是显示手术复杂性的特征,是手术持续时间预测的重要特征。外科手术类别是一组外科手术参数中的一个参数,这些参数被记录用于外科手术计费。医院A为外科手术构建了四个参数,而医院B有五个参数,如表1所列。当患者需要特定的外科手术时,外科医生将保留手术时间表。手术中记录的手术程序名称预约表格被转换成医院的外科手术参数。医院有一个可操作的政策标准来分类手术过程名称转换为手术过程参数。参数彼此相关,以根据外科手术名称表示外科手术复杂性和所需资源。出于手术室中的操作和管理目的,医院利用这些参数作为一组外科手术参数。因此,我们使用集合中的所有外科手术参数作为特征来预测手术持续时间,即使我们的结果表明外科手术类别是一个重要特征。患者年龄和性别也记录在手术预约表中。其他患者功能在手术前几小时可用。患者年龄和性别特征是分类算法的重要预测因素[21]。因此,我们分析了外科手术参数、患者年龄和性别的组合作为预测特征。为了进一步检查预测性能,我们使用了一组外科手术参数,如果排除了一个参数。表2列出了用于预测手术持续时间的所有估计算法的最佳MAE(有患者和无患者)D.R. Yuniartha等人表6医学信息学解锁25(2021)1006336使用外科手术预测手术持续时间的MAE(分钟)(有/无患者年龄和性别)。数量医院A医院B特征与患者手术与患者手术年龄和性别程序年龄和性别程序2-25.430-24.4673-25.293-23.327426.51025.14325.63323.240526.364-24.39123.038626.329-23.680-7--23.995-功能.我们使用外科专业和外科手术类别作为外科手术参数的基础,符合我们之前的显著特征分析。表2中等于2的特征数量显示了仅使用外科专业和手术类别的预测。在接下来的行中,预测与外科手术参数集合中的另一特征一起添加。增加患者年龄和性别的特征并没有导致预测改善。医院A数据集的最佳预测算法是使用线性回归获得的,MAE为25.143min,医院B数据集的最佳预测算法是随机森林,MAE为23.038 min。仅使用外科手术参数集中的特征进行预测的MAE略好于将其与患者特征相结合。因此,在我们使用分类算法进行预测的后续分析中,我们仅使用外科手术特征。3.2. 使用分类算法我们通过评估用于预测的箱数(手术持续时间类别)开始性能分析。在我们的研究中使用的分类算法是kNN,树,SVM,RF,神经网络,朴素贝叶斯,逻辑回归和AdaBoost。分类算法的评估使用准确度的原始定义,即预测箱的正确命中。我们在Orange 3.24.1版本中使用交叉验证来选择最佳算法。图3显示了与箱数相比,每种离散化技术的所有分类算法的最佳准确度(占总手术病例的比例)。图3表明,在大多数情况下,使用分层聚类的离散化对于每个箱数都获得了最佳精度。医院A数据集中的箱数例外为4和8,医院B数据集中为7,这是为等宽箱建立的。然而,图3还示出了仓的数量增加导致预测准确度降低。这可以通过以下事实来解释:更少的箱将导致具有更宽间隔的箱。较宽的分组间隔减少了手术持续时间数据的总体变化。这使得更容易预测仓,并导致高精度。然而,这个结果是一个欺骗性的预测性能。因此,我们进行了进一步分析,通过评价每个箱的预测结果来维持手术持续时间的变化。使用最好的分类算法的每个数量的箱,我们确定了箱的预测精度等于或大于0.5。我们使用混淆矩阵检查了预测结果。表3以数量和与总箱数相比的比例呈现了预测箱。表3表明,对于大多数箱数,最佳算法无法预测所有的垃圾桶。只有在医院A数据集中,对于4个箱的数量,所有箱都可以预测,并且50%的预测箱具有等于或大于0.5的准确度。基于该结果,我们选择了医院A数据集的手术持续时间类别数量作为四个箱,这是使用等宽分箱获得最好的分类算法使用选定的数量图3.第三章。箱数与分 类 算 法 的最佳准确度。箱是随机森林,精度为0.647。对于医院B数据集,7个箱的数量具有最高的可预测箱比例,尽管精度等于或大于0.5的箱的比例低于用3个箱获得的比例。因此,为医院B数据集选择的箱数为7,以保持手术持续时间的可变性。这一数量的箱由分层聚类产生。使用选定数量的箱的医院B数据集的最佳分类算法是具有0.641的准确度的SVM。表4列出了选定的 分类算法的bin,代表手术持续时间类别。我们还研究了每个外科专业的预测性能,以通过评估外科专业水平的预测性能,使用分类算法获得手术持续时间预测的综合结果。表5列出了 具有准确预测bin(A)、预测高于实际bin(高估/O)或预测低于实际bin(低估/U)的手术病例。除了医院A数据集中的眼科和医院B数据集中的神经外科外,大多数专科的A病例比例高于O和U病例。然而,我们发现一些专业的A病例比例低于整体专业的预测性能(分类算法的最佳准确性)。在接下来的分析中,我们将使用一组外科手术参数比较估计和分类算法的预测性能。3.3. 使用数值和分类值预测手术持续时间的性能比较我们比较了估计和分类算法的预测性能,以评估手术持续时间D.R. Yuniartha等人表7医学信息学解锁25(2021)1006337手术持续时间bin的预测结果。医院A医院B预测的箱数精度箱数预测的箱数精度箱数≥0.50 ≥0.50Number比例Number比例Number比例Number比例320.6710.3320.6720.67441.0020.5020.5010.25520.4010.2030.6020.40630.5010.1740.6720.33720.2910.1450.7130.43830.3820.2550.6330.38940.4420.2250.5630.331060.6020.2050.5020.20表4用于分类算法的箱。医院A医院B表6使用数值和分类值预测手术持续时间的比较结果。2 92.53 1504 207.51752457 - 300表5使用手术持续时间分类值预测专科的准确性外科专科医院A医院B手术持续时间数值)基于bin中点基于bin模式的MAE准确度(手术持续时间分类值的预测)基于MAE的准确度准确度基于面元-28.023 - 24.347-25.364 - 26.308-0.647 - 0.6410.599 - 0.644--0.567 - 0.641-0.647 - 0.599分类值可用于适应数值变化。表6列出了使用最佳算法获得的比较结果。 我们使用了基于分类算法的预测箱的中点和模式。的使用数值预测手术持续时间的MAE是从估计算法获得的最佳MAE。MAE基于斌的 中点 (mode) 是 的 Mae 为 的 分类算法使用修改后的错误计算。使用分类值的手术持续时间预测的准确性是分类算法的最佳准确性。我们利用估计算法产生的MAE作为修正准确度计算的阈值。基于MAE的准确度是估计的修正准确度,通过比较误差和MAE的大小,确定了最佳的MAE算法。基于箱的中点(模式)的准确度是分类算法的修正准确度,其通过比较修正误差和MAE来确定。我们通过检查分类算法的修改后的错误和准确性开始分析。我们的两个数据集有更好的预测性能与不同的计算方法。对于医院A数据集,基于箱的模式的修改后的准确度为宾模基于面元中点的MAE高于基于面元中点的MAE,基于面元中点的MAE低于基于面元中点的MAE。然而,对于医院B数据集,基于箱中点的MAE和修正精度优于基于箱模式的MAE和修正精度。然而,优选的修正精度具有与原始精度相同的值两个数据集的分类算法准确度(使用手术持续时间分类值的预测准确度)。两个医院数据集的分类算法的优选MAE(基于箱中点或模式的MAE之间水平,我们根据估计算法的MAE和手术持续时间的实际值确定了三个准确度类别。这些类别是准确的(A),高估的(O)和低估的(U)。这些类别与表5中列出的类别略有不同。A类是预测误差小于或等于MAE。O类是指预测误差高于MAE,预测手术持续时间高于实际手术持续时间。相反,U类是指预测误差高于MAE,预测手术持续时间低于实际手术持续时间。分类算法的手术持续时间的实际值和预测值是bin类别,预测误差是修改后的预测误差。表7列出了每个外科专业的估计和分类算法的三个准确度类别。预测结果,无论是使用估计或分类算法,表明准确的比例,(A)每个外科专业的预测比那些高估(O)或低估(U)的预测。对于大多数外科手术 特色菜, 的比例 准确的预测 使用时间跨度(分钟)间隔(分钟)时间跨度(分钟)间隔(分钟)医院A估计分类医院B估计分类135-92.557.55–3530MAE(预测值为25.143-23.038-一OU一OU一般0.650.110.240.610.210.18牙齿和口腔0.730.090.180.500.190.31泌尿外科0.710.060.240.610.200.19耳鼻0.800.050.151.000.000.00骨科0.490.190.320.610.150.24妇产科0.500.300.200.590.220.20眼科0.330.330.330.920.000.08儿科---0.560.220.22消化---0.720.090.19肿瘤学---0.670.050.29胸---0.730.030.25神经外科---0.370.210.42D.R. Yuniartha等人医学信息学解锁25(2021)1006338表7使用数值和分类值预测手术持续时间的准确性外科专业医院A医院B估计算法分类算法估计预测分类算法一OU一OU一OU一OU一般0.6090.1740.2170.6740.0430.2830.5760.1880.2350.5880.2120.200牙齿和口腔0.7730.1360.0910.8640.0000.1360.4380.3130.2500.5000.1880.313泌尿外科0.8240.0590.1180.6470.0000.3530.7070.1730.1200.6270.1870.187耳鼻0.7000.1500.1500.7000.0500.2500.9330.0000.0670.9330.0000.067骨科0.4490.3040.2460.5220.0870.3910.5770.2440.1790.5830.1540.263妇产科0.5000.3000.2000.7000.1000.2000.6460.1710.1830.6340.1710.195眼科1.0000.0000.0001.0000.0000.0000.9230.0000.0770.9230.0000.077儿科------0.5560.3330.1110.5560.2220.222消化------0.6940.1890.1170.7120.0810.207肿瘤学------0.4760.3100.2140.6430.0480.310胸------0.8500.0750.0750.7750.0250.200神经外科------0.6840.1580.1580.4740.1050.421分类算法的结果等于或接近使用估计算法获得的结果。4. 讨论本研究旨在研究预测手术持续时间的简单模型的性能。该模型仅使用一组手术操作参数作为预测特征,并预测手术持续时间分类值,以减少数值的变异性。由于详细的临床数据不易获得[4],我们使用了自外科医生要求手术时间表以来最初可用的手术参数。这些参数由医院构建用于计费目的,并代表手术室中的资源使用。我们使用估计算法的数值实验表明,手术程序类,这是一个参数的手术程序参数集,有助于改善预测误差。外科手术类别是由医院构造的参数,用于表示手术复杂性。与文献一致,该结果还报告称,手术复杂性是预测手术持续时间的重要特征[7,15]。外科手术程序类,以及集合中的其他参数的外科手术参数用作预测特征,导致预测误差的改善。然而,外科手术参数与患者年龄和性别的结合并没有改善预测误差。这一发现与先前的研究相反,先前的研究报告了患者性别[14,21]和年龄[21]的显著影响。然而,根据我们的结果,之前的研究报告患者特征的贡献有限[5],患者性别不是手术持续时间的有用预测因素[7]。由于现有研究中关于患者特征对预测手术持续时间的贡献存在差异,因此我们提出的模型通过利用医院的外科手术参数,消除了患者特征,但仍保持了可变性为了减少手术持续时间数值的变异性,我们提出了一个使用分类值的手术持续时间预测模型。我们使用时间箱来表示手术持续时间的类别。因为我们的结果表明,箱的数量与预测精度成反比,所以我们使用混淆矩阵X分析了每个箱数的预测性能。我们为两个数据集获得了不同数量的箱,因为医院有不同的外科专业类别,手术持续时间数据的间隔也不同。医院A数据集中有七类外科专科。医院B数据集有更多的专业,12个类别,手术持续时间数据的间隔更宽。为了评估分类算法预测手术持续时间分类值的性能,我们提出了一种改进的使用面元的中点和模式计算误差和精度。 我们的两个数据集使用不同的计算方法获得了更好的修正MAE和精度,因为它们也使用了不同的离散化技术来构建时间仓。医院A数据集的手术持续时间分组基于等宽分组,医院B数据集基于分层聚类。半宽度分箱产生具有相等间隔的分箱。对于手术持续时间数值频率最高的箱,bin,预测bin持续时间值。相反,分层聚类根据距离矩阵对手术持续时间数值进行分组。结果箱具有不相等的间隔,并且箱内的手术持续时间数值接近。因此,柱的预测中点将产生较小的误差,特别是对于较宽的间隔柱。与估计算法相比,分类算法的首选改良MAE相差不到2 min。分类算法导致MAE略高,因为它不能主要预测所有手术持续时间分类值。此外,如表3所示,医院B数据集的最佳分类算法只能预测手术持续时间类别的5个箱。该算法无法预测实际的bin类别,6和图7对这些箱类别的预测导致高预测误差,因为它们被预测到较低的箱中,这可能是不相邻的箱。表5和表7还表明,低估预测(U)的比例高于高估预测(O)这两个数据集中的大多数专业。这一结果与其他研究一致,其他研究发现长手术时间的预测不如短手术时间的预测准确[5]。在表6中,分类算法的优选修改准确度(基于箱在手术专业水平,如表7所列,外科专业之间的修正准确度不同。当预测手术持续时间数值时,该结果与早期研究的结果相匹配[4,12,13]。因此,我们的结果表明,使用手术持续时间分类值的预测获得了与使用数值的预测相当的性能。我们的研究重点是利用一组手术参数,这也是手术计费的参数,以预测手术持续时间分类值。我们研究中的数据是每家医院的个体数据,因为它与医院在确定手术计费参数时的政策有关据我们所知,只有Markazi-Moghouth等人[21]和Zabardast [22]使用分类值研究了手术持续时间预测因此,我们在比较我们的结果与以前的研究有限。然而,我们的两个数据集来自中等医院,具有足够的可变性在手术专卖和复杂性我们获得D.R. Yuniartha等人医学信息学解锁25(2021)1006339预测精度的approX iphone4百分之六十四为两个数据集。增加 因此,外科手术参数Markazi-Moghran [21]使用三种手术持续时间类别获得了约91%的准确度,Zabardast [22]使用21种类别获得了约49%的最佳准确度根据MAE,我们获得了医院A数据集的大约25分钟和医院B数据集的大约24分钟。Zabardast [22]获得的MAE约为25 min。因此,我们的结果在先前研究的性能范围内,并且与我们的发现相关,即手术持续时间的分组数与预测准确度成反比。Zab
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功