医生使用机器学习预测自杀倾向-研究报道

127 浏览量更新于2024-01-14 收藏 500KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

《中华人民共和国电信与信息服务业务经营许可证》编号：2020年第2号第1期第100337号将机器学习应用于全科医生的健康记录数据以预测自杀倾向Kasper van Mensa，d， Kazakh，Elke Elzingab，Mark Nielenc，Joran Lokkerbold，Rune Poortvlietc，Gé Donkerc，Marianne Heinsc，Joke Korevaarc，Michel Dückersc，Claire Aussemsc，Marco Helbiche，Bea Tiemensf，Renske Gilissenb，Aartjan Beekmang，h，Derek de Beursd，ia荷兰乌得勒支市，Altrecht Mental Healthcareb113自杀预防，阿姆斯特丹，荷兰c荷兰乌得勒支荷兰卫生服务研究所NiveldTrimbos研究所（荷兰精神卫生研究所），荷兰乌得勒支人文地理与空间规划，乌得勒支大学，乌得勒支，荷兰f荷兰奈梅亨，Radboud大学，行为科学研究所g荷兰阿姆斯特丹自由大学阿姆斯特丹UMC精神病学，阿姆斯特丹公共卫生（研究所）GGZinGeest Specialized Mental Health Care，荷兰i临床心理学，阿姆斯特丹公共卫生，荷兰A R T I C L EI N F O保留字：自杀全科医学电子健康记录机器学习A B S T R A C T背景：自杀行为在一般实践中很难发现。使用常规收集的数据的机器学习（ML）算法可能会支持全科医生（GP）检测自杀行为。在本文中，我们应用机器学习技术来支持全科医生使用常规收集的全科医生数据识别初级保健患者的自杀行为。方法：本病例对照研究使用的数据来自全国代表性的初级保健数据库，1.5（Nivel Primary Care Database）。选择2017年有自杀（企图）的患者作为病例（N= 574），从2017年有心理脆弱但没有自杀企图的患者中选择风险对照组（N=RandomForest在一个小的数据子样本（训练集）上进行训练，并在看不见的数据（测试集）上进行评估结果：近三分之二（65%）的病例在自杀（企图）前30天内访问了他们的家庭医生。RandomForest显示阳性预测值（PPV）为0.05（0.04-0.06），灵敏度为0.39（0.32-0.47），曲线下面积（AUC）为0.85（0.81-0.88）。几乎所有对照品均准确标记为对照品（特异性=0.98（0.97-0.98））。在650名有风险的初级保健患者的样本中，该算法将20名患者标记为高风险。其中，一个将是实际病例，另外，一个病例将被遗漏。结论：在这项研究中，我们应用机器学习来预测自杀行为使用全科医学数据。我们的研究结果表明，这些技术可以作为一个补充步骤，在识别和分层的患者在自杀行为的风险。结果是令人鼓舞的，并提供了第一步，在临床实践中直接使用自动筛选。来自不同社会领域的额外数据，如就业和教育，可能会提高准确性。1. 介绍自杀是一个重大的公共卫生问题，全世界每年估计有80万人死亡（世界卫生组织，2014年）。自杀企图的频率约为20倍（世界卫生组织，2014年）。世界卫生组织认为预防自杀是全球的当务之急，敦促各国制定和实施预防自杀的国家战略在卫生系统包括全科医生（GP）的国家，患者在进行自杀行为之前经常与他们的GP联系。研究发现，大约50%的人在自杀（企图）前一个月内有过接触（de Beurs等人，2016; Luoma等人，通讯作者：Trimbos Institute（荷兰心理健康研究所），荷兰乌得勒支电子邮件地址：ka.van. altrecht.nl（K. van Mens）。https://doi.org/10.1016/j.invent.2020.100337接收日期：2020年1月24日;接收日期：2020年6月29日;接受日期：2020年7月20日2020年8月27日的一份声明2214-7829/©2020TheAuthors.由ElsevierB.V. 这是一个不可操作的CC，它与CCBY-NC-NDLicense（http：//creativecommons.org/licenses/BY-NC-ND/4。0/）。可在ScienceDirect上获得目录列表互联网干预杂志首页：www.elsevier.com/locate/inventK. van Mens，等.《中华人民共和国电信与信息服务业务经营许22002年;Stene-Larsen和Reneflot，2019年）。全科医生事后指出，在这些最终接触者中，自杀行为是30%的严重风险（Marquet et et al.，2005; de Beurs等人，2016年）。自杀意念，与未来自杀行为风险增加相关（Franklin et al.，2017年，一般都很难发现。很少有患者主动向全科医生表达自杀想法。Pearson et al.（2009）报告称，只有15%的患者在自杀前的最后一次咨询中表达了自杀想法。这强调了全科医生主动探索自杀的重要性。然而，最近荷兰的一项研究表明，在抑郁症患者中，自杀行为的明确风险组（Hawton等人，2013），全科医生仅在这些患者中的44%中探索了自杀倾向（Elzinga等人，2019年）。因此，这个群体可能仍然太大，不明确的全科医生系统地探讨自杀的感觉。基于算法的自动预筛选工具可能有助于全科医生确定哪些患者最有可能有自杀行为的风险。机器学习（ML）技术可用于检测包含许多不同预测因子的大型患者数据集中的模式（ Kuhn 和 Johnson ， 2013; Walsh 等人， 2017 年 ;Kristesta等人，2016年;富兰克林例如，2017年）。早期的研究显示，仅使用来自电子健康记录的数据预测患者自杀（企图）的结果令人鼓舞（Kessler等人，2015; Barak-Corren等人，2017; Simon等人，2018; Walsh等人，2017年）。总体而言，这些研究产生了准确的分类模型。然而，由于自杀是如此罕见的事件，即使是最轻微的预测错误也会导致高假阳性率，这意味着患者将被错误地归类为自杀。因此，预测模型不应被视为替代，而应被视为识别和分层未来自杀行为风险患者的补充步骤识别有自杀行为风险的初级保健患者的一种可能方法最后一步将包括全科医生积极评估标记患者的自杀意念。本研究旨在通过将ML技术应用于大型且具有代表性的初级保健数据库（Nivel数据库），支持第二步（识别自杀行为）中的全科医生。最终，目标将是创建一个自动信号系统，在患者未来自杀行为的咨询过程中警告全科医生。虽然这项技术有可能大大加强对高危患者的及时发现和治疗，但目前仍处于起步阶段。本研究旨在通过测试其对来自GP保存的医疗记录的真实咨询数据的预测2. 方法2.1. 数据集在这项病例对照研究中，我们使用了Nivel初级保健数据库，其中包含2017年约500个全科诊所的代表性样本，包括超过150万名注册患者（约占荷兰人口的10%）。Nivel从电子健康记录系统中收集常规记录的信息。在荷兰的医疗保健中，保险是强制性的，每个人都被分配给全科医生（Kroneman等人， 2016年）。这意味着数据库代表了总人口。需要注意的是，登记并不总是反映面对面的协商，也可能包括行政行为或电话协商。我们比较了2017年登记自杀（企图）的患者与没有记录自杀（企图）的2.2. 伦理声明荷兰法律允许在某些条件下将电子健康记录用于研究目的。根据这项法律，无论是对于这类不含可直接识别数据的观察性研究，必须获得患者的知情同意或医学伦理委员会的批准（荷兰民法，第7：458条）。本研究已根据Nivel Primary Care Database的管理代码（编号NZR-00318.009）获得批准。2.3. 例根据国际初级保健分类（ICPC）系统（Lambert和Wood，1987），会诊和其他登记在数据中标有诊断。ICPC代码共有685个，集中在17个不同的章节中;例如心理（P）或社会（Z）章节。由于自杀和自杀未遂都在P章中登记为P77，因此它们不能相互区分。选择2017年登记P77的患者作为病例。患者可能多次登记P77，有时甚至在一周内，可能指的是一次自杀（企图）。因此，我们通过选择2017年P77的第一个记录作为自杀（企图）的时间来操作我们的病例。排除了2016年或2015年也有P77记录的患者，以确保2017年的首次登记最有可能涉及新的自杀事件。这总共产生了574例新的自杀（企图）病例，这意味着患病率为0.12%（在2017年至少登记过一次的486，488名初级保健患者中）。然后，我们添加了有关活动前12个月内初级保健服务使用的信息。其中40名患者被排除在模型构建过程之外，因为他们在过去12个月内没有任何登记，并且无法通过GP系统中实施的自动信号技术识别。2.4. 控制我们的目标是从高危人群中识别出自杀行为。我们选择了心理脆弱的患者作为风险患者，这些患者在其患者档案中至少有一个心理相关记录（N= 207，308）。对于每种对照品，还包括2017年首次记录前一年的注册数据。与病例一样，2017年没有任何登记的对照患者在模型构建过程中被进一步排除。2.5. 至事件在Nivel数据库中，患者可以在一年中的任何一天登记为了创建计算上可行且有意义的特征，使用月作为时间单位。自杀（企图）或对照事件前1 - 30天内的所有登记均按“前一个月”分组，31天至61天内的登记按“前2个月”分组，62天至92天内的登记按“前3个月”分组，93天至365天内的每次登记按“前4 - 12个月”分组。后一组被视为9个月的基线期，用于计算之前第一、第二和第三个月每个月2.6. 特征工程与为研究目的收集的数据不同，注册数据的收集不是为了回答特定的研究问题。Nivel数据库中的原始数据包含了许多关于服务使用的细节，这些细节很可能与预测自杀行为无关。因此，从原始数据中进行特征工程对于识别有意义的服务使用模式是必要的（James等人，2015年）。基于专家知识和文献创建了几种特征类型（Kämpfer等人， 2016;Leavey等人， 2016年; Pedersen 等人， 2019; Wiborg等人，2013;Windfuhr等人，2016; de Beurs等人，2016年; Marquet等人，2005年）。K. van Mens，等.《中华人民共和国电信与信息服务业务经营许31. 在自杀（企图）前第一、第二和第三个月，每个ICPC集群的登记数量2. 基线期（自杀（企图）前4-12个月）每个群集每月的平均登记数量3. 与基线登记数相比，第一、第二和第三个月4. 第一、第二和第三个月的心理（P）、社会（Z）和医学上未指明的身体症状（MUPS;见第二章X）5. 在自杀（企图）前的第一个月、第二个月和第三个月，P-集群中每个单独ICPC代码的登记数量。2.7. 描述性统计量首先，我们提出了基本的统计数据来描述自杀病例的风险控制我们显示了有多少患者在登记自杀（企图）之前的一周和几个月内拜访了全科医生，我们描述了自杀（企图）之前最后一次咨询的原因该描述包括在事件发生前一年内未接受任何咨询的患者，这些患者被排除在模型构建过程之外。2.8. 建模策略在这一阶段，我们的数据包括534例病例。基于ML原则，我们创建了一个训练样本（70%）来构建我们的模型，并创建了一个测试样本（30%）来评估我们的最终模型。我们创建了病例的随机子集（N=373），并添加了1865个随机对照以创建训练集（N= 2238）。为了提高分类器的性能，我们对对照组进行了欠采样，以人为地将自杀（企图）的患病率提高到17%。根据经验，大约17%可以被视为平衡数据集的阈值（He和Garcia，2009）。我们使用10倍10倍交叉验证来估计模型的性能并选择最终模型。在真实环境中对最终模型进行了一次评价，该评价使用了由剩余161例病例组成的不可见测试样本。为了代表该数据集的风险组（0.28%）中自杀（企图）的真实患病率，将53，666名对照添加到测试集中。在模型竞争研究的指导下（Hagenauer等人，2019; Fernán-Delgado等人，2014），使用随机森林算法来创建预测模型。randomForest是集成学习的一个例子，集成学习是一种将多个预测器组合起来进行单个预测的算法。在randomForest的情况下，多个决策树被组合以创建一个“森林”。每个决策树递归地将数据划分为更小的子集，直到子集中的所有患者具有相似的结果（病例或对照），或者直到进一步的划分不增加预测值决策树具有能够模拟复杂的相互作用和非线性关系的优势。随机森林模型的缺点是，表1多个决策树的组合可以创建一个黑框，其中输入和预测之间的关系可能难以解释。使用如在统计软件R中实现的包randomForest（Breiman等人， 2015年）。2.9. 性能度量使用灵敏度、特异性、曲线下面积（AUC）、阳性预测值（PPV）和平衡准确度评价模型性能。敏感性是指在所有案件中被正确分类的案件所占的比例。专属性表示所有质控品中被正确分类为质控品的质控品比例。AUC总结了灵敏度和特异性之间的权衡。PPV是正确预测病例在所有预测病例中的百分比（Kuhn和Johnson，2013）。平衡准确度描述了正确分类的平均比例为此使用R包caret和pROC（Kuhn等人，2017;Robin等人， 2011年）。2.10. 变量重要性虽然随机森林不像传统模型那样产生预测系数来描述变量的影响，但可以根据变量的重要性对其进行排序（Kuhn和Johnson，2013）。变量的重要性描述了变量对模型改进的贡献程度。我们使用randomForest包中实现的置换重要性选项来确定变量的重要性。它表示在随机森林的所有树上置换特定变量后分类性能的平均下降（Breiman等人， 2015年）。2.11. 资金来源资助者在研究设计、数据收集、数据分析、数据解释或本文的撰写中没有任何作用。通讯作者可以完全访问研究中的所有数据，并对提交发表的决定负有最终责任。意见、解释、结论和建议是作者的意见、解释、结论和建议，不一定得到资助者的认可3. 结果表1显示了574例自杀（未遂）病例和207，308例对照组的人口统计学特征。与对照组相比，病例与对照组相比，他们在前一年的平均登记数量更高，在前一年至少咨询过一次全科医生的比例更高。此外，病例因心理和社会问题咨询的次数约为两倍，并且他们更经常记录医学上无法解释的身体症状（MUPS）。在图1中，给出了在给定时间段内在GP处出现的病例数。大约四分之一的病例病例和风险对照组的人口统计学特征病例风险对照组ap值数量574 207，308男性所占百分比平均年龄（SD）46（17）52（19）0.001<一年平均登记数（SD）18（19）10（12）0.001<至少登记一次的百分比93% 86% 0.001<因心理原因登记的总人数百分比<因社会原因登记的总人数百分比12% 6% 0.001<至少有一个MUPS注册的百分比60% 51%0.001

下载后可阅读完整内容，剩余1页未读，立即下载