没有合适的资源?快使用搜索试试~ 我知道了~
数据科学与管理2(2021)45研究文章基于机器学习的在线门诊预约中未就诊患者的预测模型范国瑞a,邓兆华b,*,叶庆a,c,王斌da华中科技大学同济医学院医药卫生管理学院,430074,武汉,中国b华中科技大学管理学院,430074,武汉,中国c华中科技大学同济医学院附属同济医院信息管理系,430074,武汉,中国d罗伯特·C. Vackar College of Business and Entrepreneurship,University of Texas Rio Grande Valley,Bennburg,TX 78539,USAA R T I C L E I N F O保留字:在线健康在线门诊预约患者未就诊预测模型机器学习A B S T R A C T随着信息和通信技术的发展,中国所有公立三级医院开始使用在线门诊预约系统。然而,在线门诊预约中的患者未到现象也越来越严重。本研究的目的在于设计一个病人缺席行为的预测模型,以协助医院做出相关决策,降低病人缺席行为的发生率我们使用了382,004份原始在线门诊预约记录,并将数据集分为训练集(N1 1/4 286,503)和验证集(N2/4 95,501)。我们使用机器学习算法,逻辑回归,k-最近邻(KNN),boosting,决策树(DT),随机森林(RF)和bagging,设计在线门诊预约中患者未出现的预测模型。在线门诊预约的患者未就诊率为11.1%(N¼ 42,224)。从验证集来看,装袋具有最高的ROC曲线下面积和AUC值,为0.990,其次是随机森林和增强模型,分别为0.987和0.976。相比之下,与先前的预测模型相比,逻辑回归、决策树和k-最近邻的ROC和AUC值下的面积分别较低,为0.597、这项研究证明了使用来自多个来源的数据来预测患者未就诊的可能性。预测结果可为医院减少医疗资源浪费、制定有效的门诊预约政策、优化运营提供决策依据1. 介绍近年来,由于强调预防性医疗实践、缩短住院时间和在门诊基础上提供服务,门诊诊所已经占据了卫生保健系统的中心舞台(Hooshan-gi-Tabrizi等人, 2020; Pan等人, 2021; Srinivas和Ravindran,2020)。门诊预约调度系统已经成为门诊诊所中有效护理交付和需求管理的重要组成部分(Javid等人,2017; Kuiper等人,2021年)。在中国,“看病太难”是一个持续存在的问题(Liu,2009 ; Yip和Hsiao,2008 ; Zhang等人,2014年)。 为了调节医院服务能力并满足患者需求,医疗保健提供者广泛使用门诊预约调度系统(Liu,2016)。有效的门诊预约制度,可改善医院的运作效率和提供的医疗服务,并提高患者满意度和提高医院的经济和社会效益(Lee等人, 2018年)。为了简化医疗机构的运营,为偏远地区的患者提供更好的医疗服务,并创建良好的门诊预约诊断和治疗服务系统,在线预约系统作为基于互联网的新型预约系统已经受到中国医院的广泛关注(Caoetal.,2011年)。随着信息和通信技术的发展以及中国卫生部的支持,中国所有公立三级医院于2009年开始使用在线预约系统(Zhang等人, 2014年)。然而,随着门诊网上预约排期的日益普及,门诊网上预约系统中的病人漏诊行为也越来越严重。病人未到是指病人没有在预约时间来到诊所或医院或取消预约的情况同行评议由Xi交通大学负责* 通讯作者。电子邮件地址:zh-deng@hust.edu.cn(中)Deng)。https://doi.org/10.1016/j.dsm.2021.06.002接收日期:2021年4月15日;接收日期:2021年6月21日;接受日期:2021年6月22日2021年6月24日在线提供2666-7649/©2021 Xi'an Jiaotong University.出版社:Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表数据科学与管理杂志主页:www.keaipublishing.com/en/journals/data-science-and-managementG. Fan等人数据科学与管理2(2021)4546在预约时间之前不久(通常在一天内),导致预约时间段没有被填满(Ding等人, 2018; Huang和Hanauer,2014)。目前,我国大部分医院门诊预约的未就诊率为10%-20%,少数医院超过30%(Cronin etal.,2013; Ding等人,2018; Dis-telhorst等人, 2018; Kheirkhah等人,2016; Lenzi等人,2019年)。门诊患者的高预约率导致医疗资源的浪费,减少了其他患者获得他们所需的医疗保健的机会(Fiorillo等人,2018),减少患者的健康状况(Kheirkhah等人, 2016; Kurasawa等人,2016; Lenzi等人, 2019),并导致医疗资源的次优分配(Alaeddini等人,2015; Nuti等人,2012年)。患者的不就诊行为会扰乱正常的门诊秩序,导致门诊医生工作时间延长,增加医生工作负担,降低医院运行效率,不利于正常医疗秩序的建设(Lee et al., 2018年)。与此同时,患者的缺席行为不仅会对医院管理产生负面影响,还会对医疗系统的财务表现和资源利用产生重大影响(Liu,2016)。本研究的目的是预测在线门诊预约系统中患者的未到行为,以减少此类行为的不良后果,提高医院门诊预约系统的运行效率,更好地利用医疗资源。先前关于患者未出现的研究依赖于使用药物预测因子(Ding等人,2018; Lekham等人, 2020; Lenzi等人, 2019年)。在线门诊预约系统中,不仅医生自身因素会影响患者的不就诊行为,医生的在线声誉等在线因素也会影响患者的不就诊行为。我们的研究是第一个将在线和在线因素结合起来预测患者不出现的研究。此外,机器学习被广泛用于开发 风 险 预 测 模 型 ( Goldstein 等 人 , 2017 ) , 例 如 预 测 患 者 再 入 院( Bardhan 等 人 , 2014 ) , 识 别 患 者 不 良 事 件 ( Rochefort 等 人 ,2015),以及开发住院患者死亡率预测模型(Tabak等人, 2014年)。因此,本研究应用机器学习算法来构建患者未出现行为的预测模型有效的预测结果可以帮助医院做出相关决策,降低患者通过网上预约门诊系统预约的漏诊概率,提高医院门诊的运营效率,提高医院的经济效益和社会效益。2. 文献综述2.1. 在线门诊预约排程提供优质及高效的医疗服务以满足患者新的健康需求是中国医疗行业面临的主要挑战之一(叶及萧,2014)。资讯及通讯科技的迅速发展,以及互联网及移动设备的使用日益增加,令中国的网上医疗服务行业蓬勃目前,中国的三级公立医院通过在线平台提供各种医疗服务,包括微信平台、自主开发的应用程序以及与第三方平台合作提供的各种服务。提供的服务主要包括在线咨询(Kamsu和Foguem,2014; Wu和Lu,2017),门诊预约安排(Colaci等人, 2016; Hoque,2016)、电子医疗处方和在线支付。在这些服务中,门诊预约排程是使用率最高的服务,也是我们研究的重点在线门诊预约排程系统通过互联网提供医疗服务。患者可以通过网站或手机应用程序进行门诊预约(Mold and Lusignan,2015)。在线门诊预约打破了固定的时间和距离障碍。通过在线门诊预约,医院可以为农村和农村地区的患者提供有效的医疗服务,偏远地区,扩大医疗服务覆盖面(Ahmed et al., 2014; Xie等人, 2017年)。门诊服务需求的增加,加上医生供应的短缺,将导致供需不匹配,如资源枯竭,医疗差错,生产力下降,病人等待时间延长,预约延误时间延长。因此,患者满意度和资源利用将受到负面影响(Srinivas和Ravindran,2018)。与此同时,建议在线门诊预约以改善工作流程,从 而 减 少 等 待 时 间 并 改 善患者 体验 ( Mey和 Sankaranarayanan ,2013)。2.2. 患者未出现行为此前的研究表明,患者未就诊现象并非偶然,患者未就诊行为的发生会受到多种因素的影响(Cronin et al. 2013; Daggy等人, 2010; Dantas等人,2018年)。临床研究表明,患者的人口统计学特征可能会影响他们的未就诊行为,并且年轻患者更有可能在门诊预约中未就诊(Cronin等人,2013; Fiorillo等人, 2018; Lehmann等人, 2007),但一些研究表明,年轻患者在门诊预约中的失约率较低(Zhou等人,2018年)。与此同时,一些研究表明,年龄对患者未出现在预约中没有显著影响(Dantas等人, 2019年)。 就性别对患者未就诊行为的影响而言,先前的研究表明,与男性相比,女性在门诊预约中未就诊的风险较低(Liu,2016),其他研究显示了相反的结果(Kheirkhah等人,2016年)。此外,患者的收入、婚姻状况、种族和其他特征可以影响患者的不出现行为(Daggy等人, 2010; Lee等人, 2005; Lehmann等人,2007年)的报告。在预约时间方面,预约提前时间长的患者在门诊预约中 没有 出现 的风 险更 高(Chang等 人, 2015; Peng等 人, 2016;Rosenbaum等人, 2018年)。由于门诊系统通常在周末不开放,患者在周一的未就诊率较高,下午的预约也有较高的未就诊率(Cronin etal., 2013; Peng等人, 2016年)。一些研究发现,患者就诊门诊当天的天气状况也是患者未就诊行为的重要预测因素(DeFife等人, 2010; Peng等人, 2016年)。此外,患者与医院的距离(Daggy等人,2010; Dantas等人, 2019; Whiting等人, 2015)、既往患者访视经验(Fiorillo等人, 2018; Jain和Chou,2000),医疗保险(Peng等人, 2016;Whiting等人, 2015),预约渠道(Zhou et al., 2018)和任命规定(Jain和Chou,2000; Rosenbaum等人, 2018年)也会影响患者在门诊预约中的不出现行为。为了有效地预测患者的未就诊行为,病人不出现对医院的负面影响,这项研究使用机器学习算法来预测病人不出现的行为,使用在线门诊预约数据。2.3. 预测患者未就诊在过去的几年中,患者未就诊一直是广泛研究的主题,机器学习算法在这些研究中的应用越来越多。 基于正则化逻辑回归和套索回归,Ding等人(2018)构建了三个水平的预测模型,并表明特定临床模型优于一般模型。Lenzi等人(2019年)使用混合效应逻辑将既往未就诊率以及是否为当天预约确定为患者未就诊的最重要预测因素 Simsek等人(2021)建立了一个基于树增强朴素贝叶斯的模型来预测少数民族患者的不出现。Srinivas和Salah(2021)使用随机森林、随机梯度提升和深度神经网络来预测患者未出现。并发现随机梯度提升分类树具有最好的性能。另一项研究使用了基于对立、自适应和群体智能的新包装方法G. Fan等人数据科学与管理2(2021)4547¼算法 结果显示,在尺寸减小和收敛速度方面性能更好,曲线下面积(AUC)相似,灵敏度和特异性评分高(Aladeemy et al., 2020年)。在农村地区的门诊初级保健,Lekham等人。(2020)发现,预约前置时间是使用逻辑回归、决策树和基于树的集成分类器预测患者未就诊的重要因素。通过使用逻辑回归,随机森林,梯度助推器和人工神经网络,Srinivas(2020)发现单一模型在预测性能,训练时间和可解释性方面无法表现最佳。患者未就诊的重要预测因素是既往未就诊史、年龄和下午预约。2.4. 研究差距和对文献的贡献我们的研究确定并解决了文献中与患者未就诊预测相关在线门诊预约中,患者更容易受到医生在线声誉然而,现有的门诊预约系统中患者不就诊的研究仅关注门诊预约系统的特征,而忽略了在线信息对患者不就诊行为的影响,如医生的在线声誉我们的研究通过将在线医生评级作为特征之一来解决患者未出现预测文献中的这一差距据我们所知,除了病人信息和预约信息外,这项工作是第一个使用在线医生评级预测病人缺席行为的工作之一。基于门诊预约数据,本研究创新性地整合了在线生成的数据作为预测变量,以更好地理解在线门诊预约背景下患者的未就诊行为。 这项研究证明了使用患者和门诊预约系统的数据来预测患者不出现的可能性。3. 材料和方法3.1. 研究背景和现有数据本研究以华中地区某大型综合性医院为研究对象我们提取了2019年5月至8月电子病历系统中的门诊预约记录数据,共计454,217条门诊就诊记录。然后,我们选择了使用网上门诊预约系统的患者作为我们的研究样本 医院门诊医生的评分来自好医生在线(www.haodf.com),因为它是中国最早和最大的在线医生评论和在线医疗社区网站(Hao,2015)。 这两个数据集使用医生的名字合并。删除任何不完整或错误的记录,以确保数据的可靠性删除无效记录后,我们获得的样本量为382,004。3.2. 因变量定义先前的研究将患者的不出现行为定义为“患者没有根据预定的预约出现或在接近预定的预约时间时取消预约”的情况(例如在预定的预约当天或之前取消预约),因此,门诊预约不能重新分配给另一名患者(Ding等人, 2018;Huang和Hanauer,2014; Lenzi等人, 2019年)。 根据医院的门诊预约排期机制,我们将病人的失约行为定义为病人在早上6时后未能出席预约或取消门诊预约。在预约的当天3.3. 预测变量除了年龄 和性别外,本研究 的主要预测因素 是预约前置时间( Leadtime ) 、 预 约 时 间 、 工 作 日 预 约 、 在 线 医 生 评 级 ( DOCRATING)、预约医生类型(DOC TYPE)、患者离医院的距离(Distance)、既往门诊就诊经验(EXP)和其他预测变量,共15个预测因子。预约提前期是指患者的门诊预约创建时间与预约时间之间的患者访视时间是指患者访视的时间(上午或下午)。工作日预约是指患者在一周内安排的预约日(星期一、星期二、星期三、星期四、星期五或周末)。 在线医生评级是门诊医生的在线评级,范围从0到5。 声誉是医疗服务的重要质量因素(Huang和Zuniga,2014),也被认为是医生最有价值的属性(Romano和Baum,2014)。越来越多的中国消费者使用在线医生评论来评价他们的医生或寻找特定的医生来解决他们的医疗保健问题(Huang和Hanauer,2016)。因此,门诊医生的声誉会影响患者的不就诊行为。我们使用在线医生评级来衡量门诊医生的声誉。预约医生类型是由医生预约的类型(专家或定期)来衡量的。患者与医院的距离是通过患者所在地到医院的距离来测量的(小于300 km或大于300 km)(Ye等人,2019年)。既往门诊就诊经验通过患者是否首次到门诊就诊来衡量。 医院区涵盖了三个不同地理位置、规模和医生组成的地区。患者登记时间为患者在预约系统中登记的日期。 预约创建时间是指患者在预约系统中创建门诊预约的日期。预约医生头衔是医生的医学头衔(例如, 教授、副教授或其他)。患者所在省份是指患者居住的省份,预约时间是指患者与门诊预约时间的日期。3.4. 选定的特征和预测模型为了消除冗余的共线特征,我们通过使用最小绝对收缩和选择算子(LASSO)识别最具预测性的变量来执行特征选择(Fu等人, 2018年;Gao等人, 2020年; Liang等人,2020年)。 LASSO将特征系数的L1范数作为惩罚项添加到损失函数中,这迫使对应于这些弱特征的系数为零(Gao等人, 2020年)。因此,我们将系数为零的特征视为冗余特征并将其删除。从门诊预约系统获得的17个特征中,我们获得了15个特征,包括12个分类特征和3个连续特征,这些特征经过LASSO的特征选择,如图所示。1.一、接下来,我们将数据集随机划分为训练数据集(N11/4286,503)和验证数据集(N2 95,501)。该研究使用训练集来训练患者未出现预测模型,并使用验证集来评估模型性能并确保预测模型结果的鲁棒性。我们在训练集中使用了十重交叉验证,以确保结果的准确性在这个过程中,训练集被分成10个子集,其中9个子集用作训练集,其余子集用作测试数据集。该过程重复十次,其中十个子集中的每一个在这项研究中,机器学习算法,包括逻辑回归(LR),k-最近邻(KNN),决策树(DT),随机森林(RF),装袋,和boosting被用来设计患者未出现预测模型。LR算法是医学环境中广泛使用的分类器(Srinivas,2020;Srinivas和Ravindran,2018)。作为一种懒惰学习算法,KNN是最基本、最简单的分类方法之一最近,决策树在医疗决策支持中也发挥了重要作用,例如预测患者未就诊和临床诊断(Alves et al.,2021; Lekham等人, 2020年)。已知结合多种算法的预测的包络方法可降低方差并产生优异的预测性能(Polikar,2012)。因此,我们的研究也考虑使用随机G. Fan等人数据科学与管理2(2021)4548¼¼¼¼¼¼¼Fig. 1. LASSO的功能选择。森林、装袋和提升方法来构建我们的预测模型。E·X·pert317,78883.2我们使用R语言设计患者未就诊预测模型。普通64,21616.8在手动筛选后,该研究指定了已知患者与医院最近KNN模型中的分类样本点K3对于随机森林,指定节点中二叉树中使用的变量数默认值。在我们的研究中,使用R Mltools包对分类变量进行独热编码由于本研究因变量分布不均因此,我们在训练数据集上使用R DMwR包合成少数过采样技术(SMOTE)以获得更平衡的样本(Torgo和Torgo,2013)。3.5. 预测模型评估指标模型性能通常通过精确度、召回率、准确度、F1和受试者工作特征(ROC)曲线下面积进行评估使用每个类别的混淆矩阵的输出计算度量:TP为真阳性,TN为真阴性,FN为假阴性,FP为假阳性。我们的评估指标定义如下:非首次访视125,49832.9院区1区295,71077.42区54,61814.33区患者登记时间预约创建时间预约时间31,6768.3患者来源省份a连续变量平均值标准差年龄(岁)预约所需时间(天)在线医生评分3.9 0.2Notes.a见A/CN.4/1999/Add.1。患者在一定程度上作为网上门诊预约系统精密TPTP精密FP召回TPTPFFN准确度TP公司简介F12 ×TP2×TP双FP双FN4. 结果4.1. 描述性统计量(一)(二)(三)(四)打破了距离障碍,在线预约的患者到州立医院的平均距离为184.6公里(SD¼ 313.5)。4.2. 预测模型性能预测模型的性能如表2所示。对于验证数据集,逻辑回归模型的预测准确率为68.79%。而Logistic回归模型的准确率仅为15.34%,召回率为40.33%,F1值为0.222。Logistic回归作为预测模型的性能很差。KNN的预测准确率为90.14%,略高于Logistic回归模型的预测准确率根据KNN建立的预测模型的准确率和召回率分别为53.77%和76.75%,F1表2表1显示了变量的描述性统计量汇总我们报告每个分类变量的频率分布以及每个连续变量的平均值和标准差。在门诊网上预约中,患者门诊患者的平均年龄为36.6岁(SD 19.6)。此外,40.9%的患者为男性,而59.1%为女性。在网上门诊预约中,平均预约时间为4.9天(SD 19.6),这表明网上门诊预约促进了验证数据集的预测模型结果精密度(%)召回率(%)准确度(%)F1AUCLogistic15.3440.3368.790.2220.597KNN53.7776.7590.140.6320.843提振98.3096.5799.440.9740.976表1样本描述性统计。分类变量频率百分比(%)患者未出现未入住42,22411.1显示339,78088.9性别男性156,30740.9女性225,69759.1患者就诊时间上午251,41465.8下午130,59034.2周一工作日预约85,83722.5周二76,42020.0周三70,25718.4周四68,78618.0周五46,04612.0周末34,6589.1预约医生类型不到300公里327,19185.7超过300公里预约医生职称54,81314.3设置为4。对于bagging方法,教授196,72751.5二叉树中的指定节点被设置为15。在增强中,我们将压缩参数λ1/4设置为0.1。其余模型参数为副教授既往门诊访视经验首次访问121,06164,216e256,50631.716.867.2G. Fan等人数据科学与管理2(2021)4549决策树12.6213.5880.060.1310.499随机森林79.7296.7096.920.8740.987套袋90.5296.5498.500.9340.990G. Fan等人数据科学与管理2(2021)4550价值0.632 Boosting方法的预测准确率为99.44%,高于Logistic回归模型和KNN方法的预测准确率Boosting的准确率和召回率分别为98.30%和96.57%,F1为0.974。这些结果表明,助推模型具有更好的性能。DT预测模型的准确率、精确率和召回率分别为80.06%、12.62%和13.58%,F1值为0.131。DT虽然有较高的准确率,但其精确率和召回率较低,因此模型的性能较差。对于RF预测模型,准确率为96.92%,RF的精度略低,为79.72%。由于RF预测模型具有较好的召回率和F1值,分别为96.70%和0.874,RF具有良好的预测性能。对于Bagging,精确率、召回率和准确率分别为90.52%、96.54%和98.50%,F1值为0.934。因此,bagging作为患者未出现行为的预测模型具有良好的性能。实验结果表明,Boosting、RF和Bagging方法具有较高的精确率、召回率、准确率和F1值,并且这些预测模型的性能优于Logistic回归、KNN和DT。图 2显示了每个预测模型的ROC曲线和AUC值。 Bagging算法具有最高的ROC曲线下面积和AUC值,为0.990。RF和booting也具有良好的ROC曲线下面积和AUC值,AUC值分别为0.987和0.976,其次是KNN方法,AUC值为0.843。然而,与bagging、RF、boosting和KNN预测模型相比,逻辑回归和DT的ROC和AUC值下的面积分别为0.597和0.499。DT具有最低的ROC和AUC值下的面积,因此它不适合设计患者未出现行为的预测模型。因此,boosting、RF和bagging预测模型具有最好的精确度、召回率、准确度、F1和AUC值,适合设计患者未出现的预测模型虽然Logistic回归、DT和KNN预测模型的准确率相对较高,但由于准确率和召回率较低,这些算法不适合设计在线门诊预约患者未就诊的预测模型4.3. 重要预测变量最后,我们评估了预测模型的重要预测变量。使用插入符号R包中的varImp函数计算每个模型的预测变量重要性。图3显示了所有预测因子的重要性。 在三个最佳预测模型中,患者登记时间、患者就诊时间和预约创建时间是重要的预测因素。此外,预约医生类型和患者离医院的距离是患者未就诊的重要预测因素。由于门诊在线预约系统的不同特点,我们的研究创新地发现,在线医生评分是一个重要的预测病人不出现。5. 讨论和贡献5.1. 讨论患者不出现的行为减少了收入,损害了优质医疗保健的提供许多研究致力于预测门诊预约系统中的病人不出现 与传统门诊预约系统不同,网上门诊预约系统克服了时间和空间的固定限制,提高了医疗服务的可及性和公平性。与此同时,网上门诊预约系统也有其自身的特点,如病人来自不同的地理区域,预约时间长。因此,有效地预测患者在网上门诊预约中的失约行为,对提高医院门诊服务的运行效率具有重要意义。本研究的主要目的是使用机器学习算法,如boosting,随机森林和bagging算法,设计合理的预测模型,用于在线门诊预约中的患者未出现行为。在验证集上测试预测模型的稳健性与先前的研究一致,我们发现患者预约时间、先前的就诊经历和患者的年龄是预测患者不出现的重要特征(Cronin等人, 2013; Dantas等人, 2018; Peng等人, 2016年)。早期的研究也建立了病人离医院的距离和发生心脏病的可能性之间的联系。图二. 验证数据集上预测模型的ROC曲线。图例:各图中的长实线为各预测模型系数的ROC曲线。蓝色区域表示ROC曲线下面积(AUC)。G. Fan等人数据科学与管理2(2021)4551图三. 每个预测模型的重要预测因子。图例:圆圈的大小代表相对重要性。圆圈的不同颜色表示不同模型中的特征重要性。患者未出现(Daggy等人, 2010; DeFife等人, 2010; Miller等人,2015; Zhou等人, 2018),我们的研究结果进一步证实了这一点,因为患者与医院的距离被发现是患者未出现行为的关键预测因素。患者与医院的距离是一个重要的预测因素,可能是因为在线门诊预约系统克服了空间的限制,提高了门诊服务的覆盖率此外,我们的研究还揭示了新的关键预测因素,如预约医生类型和在线医生评级,可能与在线门诊预约中的患者未出现行为有关。由于我们的研究是基于在线环境下的门诊预约系统,预约医生类型和在线医生评级作为医生个人声誉和患者感知质量的重要来源(Huang和Hanauer,2016),也是患者未就诊的重要预测因素在预测模型中集成在线和在线特征将实现更好的数字医疗保健系统,这是转换过程和实现成本效益所必需的重要转变(Duggal等人, 2018;Khan和Sakamura,2015)。具有良好预测性能的机器学习算法将为诊所和医疗保健从业者提供巨大价值,以提供有针对性的干预措施并实现有效的规划。随着越来越多的患者使用在线门诊预约系统,预测模型的构建不仅需要考虑门诊预约系统中的数据,还需要考虑在线健康的影响关于患者未出现行为的信息 本研究创新性地将在线医生评分作为预测变量,实现了在线数据与门诊预约数据的整合。结果还证实了使用多个来源的数据来预测患者未就诊的可能性。5.2. 贡献这项研究有以下实际贡献。首先,我们基于在线门诊预约数据和在线医生声誉数据,充分利用机器学习算法来设计在线门诊预约中患者未出现行为的预测模型。我们的研究结果表明,在门诊在线预约系统中使用大量数据开发有效的预测模型的潜力。 由于Boosting、随机森林和Bagging模型均能准确预测患者的未就诊行为,预测结果可为医院制定合理的门诊预约和就诊制度提供参考。例如,医院可通过调整患者缺席预测模型给出的患者缺席量、当日及未来的预约源数量等参数,优化预约排程,制定合理的超预约政策,降低患者缺席对医院效率的影响。此外,为了减少病人的不出现的行为,这可能是由于时间G. Fan等人数据科学与管理2(2021)4552和距离因素,医院可以采取有效的通知措施,减少病人的失约行为。他们还可以在不同的工作日提供不同数量的预约源,以减少在线门诊预约系统中患者未出现行为的不良后果本研究还具有以下理论贡献。 与传统的门诊预约环境不同,网上门诊预约有其独特的背景。 本研究设计了基于在线门诊预约系统的患者失约行为预测模型,并考虑了在线健康信息对患者失约行为的影响。我们的研究还证实了使用在线健康信息来预测患者未出现行为的潜力。本研究不仅有助于加深对患者未就诊行为的理解,而且丰富和补充了现有的在线门诊预约中患者未就诊行为预测模型的知识。6. 局限性和结论这项研究有以下局限性。首先,本研究中使用的数据由特定医院提供,因此研究结果的普遍性可能有限。未来的研究可以将数据源扩展到其他医院,以交叉验证我们的结果。其次,我们使用的预测变量包括患者的性别,这可能会引起伦理问题。然而,我们在数据分析中仅使用匿名数据,而不使用特定身份披露个人信息。三是线上医生评级是患者参与的结果,可能存在潜在的自我选择偏差。第四,在本研究的预测模型的构建中,只有15个变量作为预测变量。因此,未纳入我们分析的预测因素的影响未得到控制。 我们将考虑在未来的研究中增加更多的预测因子,以提高预测模型的性能。随着网络预约门诊中患者失约现象的日益严重,医院有必要对患者失约行为进行有效的预测使用机器学习算法,本研究确认了使用大量在线门诊预约数据来构建患者未就诊行为预测模型的可能性 该预测模型可以帮助医院通过预测潜在的患者不出现行为来优化其门诊预约系统,对门诊预约系统进行灵活合理的调整,以提高其整体效率。竞合利益作者声明不存在利益冲突确认本工作得到国家自然科学基金项目[No.71971092]、[No.71671073]和[71810107003]的资助。作者感谢合作医疗机构提供本研究所用数据。附录A. 补充数据本 文 的 补 充 数 据 可 在 https : //doi 网 站 上 找 到 。org/10.1016/j.dsm.2021.06.002。引用Ahmadi-Javid,A.,Jalali,Z.,Klassen,K.J.,2017.医疗保健中的门诊预约系统:优化研究综述。EUR. J.操作员Res. 258(1),3- 34.Ahmed,T.,卢卡斯,H。Khan,A.S.,伊斯拉姆河,Bhuiya,A.,Iqbal,M.,2014.孟加拉国的电子保健和移动保健举措:范围研究。BMC健康服务Res. 14(1),260.Aladeemy,M.,阿德万湖,Booth,A.,Khasawneh,M.T.,Poranki,S.,2020.基于对立学习和自适应队列智能的新特征选择方法,用于预测患者未出现。Appl. 软计算86(1月),105866Alaeddini,A.,杨,K.,Reeves,P.,Reddy,C.K.,2015.门诊预约不出现和取消的混合预测模型。IIE Trans. Health c.系统工程5(1),14- 32。阿尔维斯,硕士,Castro,G. Z.,Oliveira,文学士,费雷拉,洛杉矶,Ramírez,J.A.,席尔瓦河, Guimar~a es,F.G.,2021年使用决策树和标准图,从常规血液检查中进行基于机器学习的COVID-19诊断。Comput.生物医学132(5月), 104335巴尔丹岛哦,杰。-H、郑志,Kirksey,K.,2014年。 充血性心力衰竭患者再入院的预测分析。INF. 系统Res. 26(1),19- 39。曹伟,Wan,Y.,Tu,H.,Shang,F.,Liu,D.,中国科学院,谭,Z.,孙角,澳-地叶,Q.,徐,Y.,2011.一张网-基于预约系统,以减少门诊病人的等待:一项回顾性研究。BMC健康服务Res. 11,318.张J.T. Sewell,J.L.,戴,L. W.,2015.门诊麻醉内镜手术患者未就诊的患病率和预测因素。BMC胃肠道。15(1),123.Colaci,D.,Chaudhri,S.,Vasan,A.,2016.低收入国家为解决孕产妇健康问题采取的移动保健干预措施:一项系统性审查。Annals of Global Health,CurrentTopics in GlobalHealth 82(5),922- 935.克罗宁,公共关系,德科斯特湖,Kimball,A.B.,2013.皮肤科失约预测因素的多变量分析。Jama Dermatology 149(12),1435- 1437。Daggy,J.,Lawley,M.,威利斯,D.,Thayer,D.,Suelzer,C.,DeLaurentis,P. C.的方法,Turkcan,A.,Chakraborty,S.,桑兹湖2010.使用未显示建模来提高诊所性能。健康资讯J. 16(4),246- 259。Dantas,L.F.,弗莱克,J.L.,Cyrino Oliveira,F.L.,Hamacher,S.,2018.预约安排中的无显示-系统性文献综述。Health Pol.122(4),412- 421.Dantas,L.F.,Hamacher,S.,Cyrino Oliveira,F.L.,Barbosa,S.D.J.,Viegas,F.,2019年。预测病人不出现的行为:一项在减肥诊所的研究。奥比斯Surg. 29(2),40- 47。DeFife,J.A.,Conklin,C.Z.,史密斯,J.M.,Poole,J.,2010.心理治疗预约未出现:比率和原因。心理医生Theor. Res. Pract. 火车 47(3),413- 417。丁 , X. , Gellad , Z.F. , 马 瑟 , C. , Barth , P. , Poon , E.G. , Newman , M. ,Goldstein,文学士,2018年为不同专科和诊所的门诊未就诊者设计风险预测模型。J.Am. Med. Inf. Assoc. 25(8),924- 930。Distelhorst,K.,克劳森河,Dion,K.,Bena,J.F.,莫里森,S. L.,Walker,D.,泰,H.-L.,阿尔伯特,新墨西哥州,2018.心力衰竭出院后坚持14天办公室预约的相关因素J. 卡失败24(6),407- 411。杜加尔河,布林德尔岛Bagenal,J.,2018年数字医疗:监管革命。BMJ 360,k6。Fiorillo,C.E.,休斯,A. L.,I-Chen,C.,西门,下午,Gal,T.J.,布什,马里兰州,Comer,B.T.2018年 与耳鼻喉科学术实践中患者未就诊率相关的因素。喉镜128(3),626- 631。傅,H.,Zhu,Y.,中国科学院,王玉,刘志,张杰,谢,H.,傅,Q,Dai,B.,是的,D.,徐,J,2018年间质免疫分型的鉴定和验证可预测肌层浸润性膀胱癌患者的生存率和辅助化疗的获益Clin.癌症。Res. 24(13),3069- 3078.高,Y.,Cai,G.-是的,Fang,W.,李,H.-是的,王世文是的,Chen,L.,中国地质大学,Yu,Y.,Liu,D.,中国科学院,徐,S.,崔,P. -F.、Zeng,S.-问:冯,X.-X.,Yu,R.-D、王玉,Yuan,Y.,焦,X。F.、志,J. -H、刘杰-H、利河,巴西-地是的,郑,X.,宋角,澳-地是的,Jin,N.,龚,W.-J.,刘X-是的,黄湖,加-地Tian,X.,Li,L.,Xing,H.,妈妈,D.,Li,C.-,中国地质大学学报(自然科学版),2003 - 11R.,是的,F.,高,Q.- L.,2020.基于机器学习的早期预警系统可以准确预测COVID-19的死亡风险。Nat. Commun. 11(1),5033.Goldstein,文学士,上午,纳瓦尔,Pencina,M.J.,约翰·列侬,J.P.A.,2017.利用电子健康记录数据开发风险预测模型的机遇和挑战:一项系统综述。J. Am. Med. INF. Assoc. 24(1),198- 208。郝,H.,2015.中国在线医生评论的发展:中国最大的在线医生评论网站分析。J. Med. 因特网资源 17(6),e134.Hooshangi-Tabrizi,P.,孔特雷拉斯岛Bhuiyan,N.,巴蒂斯特,G.,2020年。使用灵活和自适应的调度程序改善肿瘤诊所的病人护理服务。 E X pert系统应用150(7月),113267。Hoque,M.R.,2016.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功