智能手机血糖预测：个性化护理在糖尿病管理中的应用

55 浏览量更新于2023-12-10 收藏 565KB PDF 举报

智能手机

科学论文

身份认证购VIP最低享 7 折!

30元优惠券

⃝⃝可在www.sciencedirect.com在线获取ScienceDirectICT Express 2（2016）150www.elsevier.com/locate/icte基于智能手机的个性化血糖预测Juan LiJiang，Chandima Fernando美国北达科他州立大学计算机科学系接收日期：2016年8月1日;接收日期：2016年10月6日;接受日期：2016年10月10日2016年10月25日在线发布摘要有效的血糖控制对糖尿病患者至关重要。然而，由于各种现实生活中的干扰，个别患者可能无法定期监测其血糖水平在本文中，我们提出了一种个性化的糖尿病预测机制，该机制利用智能手机收集的患者数据和人口数据来驱动个性化预测。与现有的预测模型不同，该模型利用合并的人群数据并捕获患者相似性，最终为个体产生个性化的血糖预测我们已经实现了所提出的模型作为一个移动应用程序，并进行了广泛的实验，以评估其性能。实验结果表明，该预测机制可以提高预测精度，弥补现有方法中数据稀疏的问题c2016韩国通信信息科学研究所。出版社：Elsevier B.V.这是一篇开放获取的文章，CC BY-NC-ND许可证（http：//creativecommons. org/licenses/by-nc-nd/4. 0/）。关键词：糖尿病;智能手机;血糖;预测;个性化护理1. 介绍糖尿病在世界各地越来越普遍。为了控制血糖水平和预防低血糖，糖尿病患者及其医疗保健专业人员需要频繁的血糖（BG）监测血糖自我监测有助于糖尿病控制，有助于创建个性化的血糖曲线。该配置文件可以帮助医疗保健专业人员为特定患者制定个性化的此外，它还可以使糖尿病患者及其家属能够在饮食和体力活动以及胰岛素或其他药物方面做出适当的日常治疗选择[1]。然而，频繁和定期监测BG水平是困难的，并且在患者的日常生活中通常是不切实际的。糖尿病患者监测血糖水平的频率因患者而异大多数专家认为，接受胰岛素治疗的患者应监测血糖至少4次，*通讯作者。电子邮件地址：www.example.comj.li @ ndsu.edu（J. Li），chandima. ndsu.edu（C.Fernando）。同行评审由韩国通信信息科学研究所负责。本文是题为《新兴市场医学诊断技术由Ki H.Chon，Sangho Ha，Jinseok Lee，Yunyoung Nam，Jo Woon Chong and Marco DiRienzo.一天，最常见的是空腹，饭前，睡前。然而，在某些情况下，患者无法保持这种频繁的监测;例如，患者可能正在开会，可能没有携带测试设备，或者可能忘记测试。因此，准确预测血糖水平对于糖尿病自我管理非常重要。已经有很多研究使用机器学习算法进行自动BG预测。例如，在人工胰腺项目[2]中，预测血糖水平，以便可以连续调整胰岛素流量以满足患者需求。尽管已有研究，但准确预测血糖水平并提出个性化建议仍然是一个挑战。现有的预测模型可以被分类为基于群体的预测（例如，[3-[7对一个患者状况的基于人群的预测实验结果表明，该模型估计个体风险的准确性相对较低。基于患者的预测通常需要大量的历史患者数据来进行可用的预测。有时，这个要求不能得到满足（例如，新病人）。到地址的上述问题现有方法，我们的工作从使用基于人群或患者的分析和预测转变为基于综合人群/患者的分析和预测。我们提出了一个个性化的以数据为中心的预测模型来预测患者http://dx.doi.org/10.1016/j.icte.2016.10.0012405-9595/c2016韩国通信信息科学研究所。Elsevier B. V.的出版服务。这是CC BY-NC-ND许可证下的开放获取文章（http：//creativecommons.org/licenses/by-nc-nd/4. 0/）。J. Li，C.费尔南多/ICT Express 2（2016）150151+−根据从智能手机收集的日常活动模式、智能手机中保存的历史信息以及历史人群数据自动确定血糖水平。我们利用人口数据来推动个性化预测。特别是，我们提出了一个三阶段的演化模型，包括一个基于个人历史的时间序列回归模型，一个合并的面板数据（PPD）回归模型，和一个预聚类的个性化回归模型。预测系统可以基于其用于预测的数据从上述三个模型中选择适当的模型。2. 相关工作已经有许多与糖尿病管理相关的风险预测研究。1996年，Shanker提出使用人工神经网络来预测亚利桑那州凤凰城附近的皮马印第安女性人群中糖尿病的发病。研究人员已经根据人群研究开发了糖尿病筛查的风险评分和预测模型[12]。最近，Choi等人开发了两种模型，使用人工神经网络和支持向量机（SVM）筛选前驱糖尿病，并进行了使用内部和外部验证对模型进行系统评估[13]。Zecchin等人量化了血糖预测在降低低血糖频率/持续时间方面的潜在获益[14]。由俄亥俄大学设计的糖尿病支持系统（4DSS）试图为正在接受胰岛素泵治疗的1型糖尿病（T1D）患者提供智能决策支持系统[15]。已经提出了不同的机器学习算法来预测BG水平。Sandham等人提出使用人工神经网络和神经模糊系统来预测血糖水平，以进行糖尿病的专家管理[8]。El-Jabali [16]使用人工神经网络创建T1 D的动态模拟模型。Plis等人[9]提出了一种BG动力学的通用生理模型，以生成支持向量回归模型的信息特征，从而预测BG水平。根据他们的实验，该模型在预测血糖水平方面优于糖尿病专家，但其精度仍然相对较低，约为42%。决策树（DT）已用于糖尿病管理的分析和预测[3，4]。例如，Pociot et al.提出了一种新的基于DT的分析方法来预测T1D [3]。Han等人使用DT从Pima Indians糖尿病数据集构建糖尿病预测模型[4]。Sudharsan等人应用随机森林（RF）、SVM、k-最近邻和朴素贝叶斯预测低血糖[5]。基于训练数据的来源，上述预测模型可以被分类为基于群体的（例如，[3-6 ]）或基于患者（例如，[7如已经提到的，它们遭受低精度和/或稀疏数据的问题。3. 方法3.1. 数据收集由于智能手机的使用几乎无处不在，我们可以使用它们来收集患者信息，例如BG定期进行的测量，以及影响血糖水平的相应日常事件，如胰岛素、进餐、运动和睡眠。的环境传感功能智能手机可以帮助我们收集一些用户信息（例如，睡眠和睡眠（自动）。一些其他数据（例如，胰岛素剂量）需要手动输入。由于它的流行，我们主要使用基于触摸的手势作为默认输入方法。收集的数据经过预处理并自动上传到云端。3.2. 个性化预测我们应用三阶段进化模型来进行更准确和个性化的BG预测。(1) 基于患者数据的时间序列预测模型由于智能手机收集的血糖测量值具有自然时间顺序，我们可以模型预测血糖水平的问题之一，预测的时间序列。时间序列是数据点的序列，通常由在一段时间间隔内进行的连续测量组成。时间序列数据集与常规数据集的不同之处在于，前者中的观测值有一个自然的顺序我们的研究局限于离散时间序列。我们的BG预测问题是使用直到时间t的BG测量来预测时间t+1处的未来BG水平。该BG预测问题可以建模如下：BG t+1= f（BG t，BG t−1，BG t−2，. . . ，BG t-n）。（一）对于具有n个点的观测BG系列，其中t是指 t n是最远的观测值，即t时的未来BG值1可以用函数f来估计。函数f被称为模型，并且用于获得估计值BGt+1。(2) 合并面板数据回归模型上述时间序列回归模型基于个体患者的历史数据进行预测。如果系统有大量的个人历史数据，这个模型可以做出更好的预测。然而，个体患者的历史数据可能非常有限。在极端情况下，个人可能根本没有任何以前的数据。我们知道，无法用时间序列回归模型进行预测是一个小样本问题。为了解决这个问题，我们建议采用面板数据来增加样本量。合并的面板数据（PPD）回归模型考虑到所有患者的历史信息能够实现跨患者信息共享的事实，从而克服了与数据稀疏性相关的问题。我们选择线性回归来实现我们的PPD回归模型来预测血糖水平。线性回归可以模拟标量因变量BG和解释（或独立）变量之间的关系。设BG表示我们希望预测其值的因变量，设X1，. . .，X k表示要预测的自变量;变量X i在周期t（或数据集的行t）中的值由X it表示。例如，在我们的数据集中，Xi可以是胰岛素剂量，低血糖症状，膳食摄入，152J. Li，C.费尔南多/ICT Express 2（2016）1501=|−|我我ˆFig. 1. 原型系统的屏幕截图。或锻炼活动。计算BGt预测值的公式为BG t= b0+ b1X1t+ b2X2t+···+bkXkt.（二）(3) 预聚类个性化回归模型PPD模型的预测性能可能受到患者多样性导致的显著基础模型异质性的为了解决这个问题并提高精度，我们将患者分成预测模型非常相似的组换句话说，我们对患者数据进行聚类，以便对相似的患者进行分组。聚类的目标是消除那些几乎没有或表1不同时间序列回归方法的比较。度量SVMDTRFRMSE68.7641.0639.73Mae63.09736.42337.586R20.057692830.296384610.79896364我们还使用UCI机器学习库中的糖尿病数据集进行了实验，以评估所提出模型的性能[18]。该数据集包括记录了70组糖尿病患者的数据。在众多比较预测模型的标准中，我们选择了三个最常用的标准，即平均绝对误差（MAE）、均方根误差（RMSE）和决定系数（R2）来评价预测性能。MAE是预测BG水平与实际BG水平之间的平均误差：nMaepy.（3）ni=1这里，p是预测的BG水平，y是实际BG水平，并且n是BG测量次数。RMSE测量预测BG水平（y）和实际BG水平（y）差异的标准差：与测试患者没有相似之处，正在制造。聚类是基于患者之间的相似性，因此与测试患者完全不同的患者将从他/她的其他聚类中的患者对测试的预测评分没有贡献RMSE=ni=1 （yi-yn（i）2.（四）病人因此，删除这些患者不会导致信息丢失聚类通过减少用于预测的数据数量提供了额外的好处，这既简化又改进了预测结果。为了衡量相似性决定系数，表示为R2，测量BG水平的方差的比例，其是可以从给定特征预测的因变量独立变量）。这是一个指标，显示数据与模型的拟合程度：在患者之间，应该应用适当的相似性测量所选择的测量应该对应于区分嵌入在R2=1−残差平方和解释平方和。（五）数据。候选相似性度量包括欧氏距离、余弦相似性、Jaccard相似性和Pearson相似性。4. 执行和评价我们已经实现了所提出的模型，并将其集成到我们的原型移动应用程序中。图1示出了在iPhone 6 Plus上运行的移动应用的屏幕截图。如图所示，移动应用向用户提供各种自我管理功能。“概览”选项为用户提供其历史健康数据的汇总视图。“葡萄糖”、“药物”、“活动”、“饮食”和“BP”选项为用户提供了一个友好的界面，用户可以通过该界面输入（或自动收集）他们的健康相关数据。在这些功能中，解释的平方和是预测值与响应变量y（BG水平）的平均值之差的平方和。第一组实验是为了分析基于患者的回归模型的性能。图2比较了三种不同的时间序列回归方法的预测性能，即基于SVM的方法、基于DT的方法和基于RF的方法。如图所示，基于SVM的方法的精度并不理想。其中RF模型的预测性能最好。表1还列出了使用三种不同误差度量的三种方法的比较。我们可以看到， DT和RF模型在RMSE、MAE和R2方面的表现优于SVM模型。在实验的第二部分，我们研究了样本数据大小的影响（即，BG测量频率）对预测准确性的影响。然后，我们验证了J. Li，C.费尔南多/ICT Express 2（2016）150153表2基于合并面板数据（PPD）的预测与基于预聚类的预测的比较2019 - 06 - 2500：00：00图二.使用支持向量机（SVM）、决策树（DT）和随机森林（RF）方法预测血糖（BG）水平。图三.使用PPD回归和不同大小的个人数据预测BG水平（I0：使用数据集中的所有样本进行基于患者的预测，I1：使用一半样本量进行基于患者的预测。I2：基于患者的预测，样本量为四分之一）。PPD回归模型弥补了基于患者的回归模型的数据稀疏性问题。图3示出了在不同大小的患者数据下的预测性能。在图中，I0表示使用数据集中的所有样本进行的基于患者的预测，I1表示使用一半样本量进行的基于患者的预测，I2表示使用四分之一样本量进行的基于患者的预测。我们通过降低BG测量频率来减少样本量。如图3所示，随着个体的BG测量的频率降低，预测准确度降低。使用I2（样本的四分之一）的预测偏离了实际值，使其成为无用的预测。图3比较了使用PPD的回归模型和使用不同大小的患者数据的回归模型的性能。我们可以看到，PPD可以有效地解决小样本量的问题，通过使用所有其他患者的历史信息，以允许跨患者的信息共享。这个实验告诉我们，在个人数据稀疏的情况下，我们可以把 PPD作为解决方案。在实验的第三部分，我们旨在验证预聚类回归将通过提供更个性化的预测来提高预测准确性。当然，与基于PPD的预测一样，这种方法也有助于解决与患者数据相关的数据稀疏问题。我们使用层次聚类根据相似性对患者进行分组。由于数据集的限制，我们只能根据数据集中指定的特征模式来度量相似性。表2比较了基于PPD的预测性能与具有不同聚类大小的基于个性化预聚类的预测的性能。从表中可以看出，后一种类型的预测更准确。基于聚类的预测捕获患者特征，因此可以做出更个性化的预测。表2还显示，当我们细化聚类时，错误率继续降低。然而，由于只有70名患者的小数据集，聚类带来的改善并不显著。从这些实验中，我们可以看到，拟议的预-基于聚类的预测与基于PPD的预测相比可以提高预测精度（例如，[3它还可以补救基于个体患者数据的方法所遭受的数据稀疏问题（例如，[75. 结论全球糖尿病流行是一个严重的公共卫生挑战。密切血糖监测对糖尿病自我管理很重要。然而，患者不一定能够定期测量其BG水平。本研究的目的是开发一种个性化的血糖预测模型，以准确和自动地预测患者的血糖水平。我们的工作从基于人口或患者的分析和预测转向基于人口和患者的分析和预测的综合。所提出的预测模型已通过广泛的模拟实验进行了评估。实验结果表明，该模型提高了预测精度，并弥补了现有模型的数据引用[1] 埃文·M本杰明，血糖自我监测：基础，临床。糖尿病20（1）（2002）45-47。[2] R. Hovorka，剑桥2013年人工胰腺项目，糖尿病医学。32（8）（2015）987-992。[3] 放大图片作者：Allan E.克劳斯·卡尔森Pedersen，Mogens Aalund，Jørn Nerup，欧洲IDDM基因组研究联盟，应用于1型糖尿病基因组扫描数据的新分析方法，Am. J. Hum. Genet. 74（4）（2004）647-660。[4] 韩建超，胡安C. Rodriguez，Mohsen Beheshti，糖尿病数据analysis and prediction model discovery using rapidminer，in：2008Second International Conference on Future Generation Communicationand Networking，vol.3，IEEE，2008，pp. 96比99度量面板2-簇三簇五簇九簇43-簇RMSE39.43836.69533.57333.07431.19327.453154J. Li，C.费尔南多/ICT Express 2（2016）150[5] Bharath Sudharsan，Malinda Peeples，Mansur Shomali，使用机器学习模型预测2型糖尿病患者的低血糖，J. Diabetes Sci. 9（1）（2015）86-90。[6] S. Priya，R.R. Rajalaxmi，一个改进的数据挖掘模型，使用神经网络预测2型糖尿病的发生，在：计算方法，通信和控制的最新趋势国际会议，ICON3C 2012，2012。[7] Alberto Pugliese ， Mingder Yang ， Irina Kusmarteva ， TiffanyHeiple，Francesco Vendrame，Clive Wasserfall，Patrick Rowe，etal.，青少年糖尿病研究基金会网络胰腺器官捐赠者与糖尿病（nPOD）计划：目标，运作模式和新的发现，儿科。糖尿病15（1）（2014）1-9。[8] W.A. Sandham，D.J. Hamilton，A. Japp，K. Patterson，神经网络和神经模糊系统用于改善糖尿病治疗，在：医学和生物学工程学会，1998年。第20届IEEE年度国际会议论文集，第3卷，IEEE，1998年，第100页。1438 -1441年。[9] Kevin Plis，Razvan Bunescu，Cindy Marling，Jay Shubrook，FrankSchwartz，一种预测糖尿病管理血糖水平的机器学习方法论文来自AAAI-14，2014。[10] Salim Chemlal，Sheri Colberg，Marta Satin-Smith，Eric Gyuricsko，Tom Hubbard，Mark W. 弗雷德里克·斯塞尔博McKenzie，使用iPhone应用程序对2型糖尿病的血糖indi vidualized预测，在：2011IEEE第37届东北生物工程年会，NEBEC，IEEE，2011，pp. 一比二[11] 穆拉利湾Shanker，使用神经网络预测糖尿病的发病，J. Chem. Inf.Comput. Sci. 36（1）（1996）35-41。[12] Henry S. 放大图片作者： Kahn ， Yiling J. Cheng ， Theodore J.Thompson，Giuseppina Imperatore，Edward W. Gregg，两种风险评分系统预测美国45至64岁成年人糖尿病发病率，Ann. Intern。150（11）（2009）741-751。[13] Soo Beom Choi，Won Jae Kim，Tae Keun Yoo，Jee Soo Park，JaiWon Chung，Yong-ho Lee，Eun Seok Kang，Deok Won Kim，使用机器学习模型筛查糖尿病前期，Comput。Math.MethodsMed.2014（2014）.[14] Chiara Zecchin、Andrea Facchinetti、Giovanni Sparacino、ClaudioCobelli，通过血糖预测方法减少低血糖事件的数量和持续时间：计算机模拟研究中的概念验证， DiabetesTechnol. Ther. 15 （ 1 ）（2013）66-77。[15] Cindy Marling，Matthew Wiley，Tessa Cooper，Razvan Bunescu，Jay Shubrook，Frank Schwartz，The 4 diabetes support system：Acase study in CBR research and development ， in ： InternationalConference onCase-Based Reasoning，Springer，Berlin Heidelberg，2011，pp. 137比150[16] A. 卡里姆El-Jabali，1型糖尿病的神经网络建模和控制，BioprocessBiosystems Eng.27（2）（2005）75-79。[17] JuanLi，Jun Kong，美国印第安人基于手机的糖尿病自我管理和社交网络系统，in：2016第18届电子健康网络&国际会议，应用服务，HealthCom'16，IEEE，2016。[18] David Newman，UCI Machine Learning Repository，2007。http：//archive.ICS。uci。edu/ml/.

下载后可阅读完整内容，剩余1页未读，立即下载