肺结核早期诊断与肺炎鉴别诊断的层叠集成分类器模型——伊朗医院病例回顾性研究

32 浏览量更新于2024-01-23 收藏 2.14MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

可持续运营和计算机3（2022）303结核与肺炎Ali Farahania，Zhao，Toktam Khatibib，c，Hossein Sarmadiand，Azam Boskabadiea计算分析和建模，路易斯安那理工大学，美国路易斯安那州拉斯顿b伊朗德黑兰Tarbiat Modares大学工业与系统工程学院，14117-13114c伊朗德黑兰伊朗医科大学医院管理研究中心d伊朗阿拉克阿拉克医科大学华盛顿州立大学卡森商学院金融与管理科学系aRT i cL e i nf o保留字：结核分枝杆菌堆叠集成分类器早期和低成本的疾病诊断a b sTR a cT结核分枝杆菌（TB）是一种感染性细菌疾病，症状与肺炎相似。因此，区分结核病和肺炎对医生来说可能是一个挑战，并导致诊断和治疗的延误。特别是结核病的早期诊断对预防社区传播至关重要。本研究的目的是提出一种使用低成本特征鉴别诊断肺结核和肺炎的方法。提出了一种基于层叠集成分类器的结核病与肺炎鉴别诊断两步决策支持系统--结核病-结核病诊断支持系统该模型的第一步旨在根据低成本特征（包括人口统计学特征和患者症状）确定早期诊断。所提出的模型的第二步基于第一步中提取的Meta特征、实验室检查和胸部X射线摄影报告来确认诊断。Meta特征是一个长度为5的向量，该向量中的每个数字都来自一个分类器的投票。这项回顾性研究考虑了伊朗阿拉克一家医院隔离病房收治的199例疑似结核病或肺炎患者的病历。实验结果表明，该方法在肺结核早期诊断中的AUC为90.26 ± 2.30，准确率为91.37 ± 2.08，95%CI;在最终决策中的AUC为92.81 ± 2.72，准确率为93.89 ± 2.81，95%CI。背景结核分枝杆菌（Mycobacterium tuberculosis，TB）是一种最常见于肺部的传染性细菌疾病[1]。感染结核菌的人可能没有症状。活动性肺结核患者需要长期治疗.结核病是全球十大致死原因之一[2]和传染病死亡的主要原因[3]。2016年，约有1040万人感染结核病，180万人死亡[2]。结核病可表现出多种症状，最常见的是咳嗽、痰中带血、发热、体重减轻、虚弱、盗汗和胸痛[1]。结核病的其他症状包括寒战，发-老虎，不适，淋巴结肿大，呼吸急促，痰多，食欲不振[1]。早期发现结核病对于有效治疗、提高存活率和防止结核分枝杆菌进一步传播至关重要。然而，现有的诊断测试并不总是能够及时有效地诊断肺部疾病。痰涂片检查和许多其他诊断工具，如血液检查，已用于早期诊断。缺点是血液测试和痰液测试是繁琐的，需要很长时间来分析，[4]虽然两者都是并不总是必要的。此外，医疗保健系统的延迟和获得实验室结果的障碍经常发生。[5]的文件。以前的研究人员已经确定，结核病的正确诊断可以采取缩略语：AUC，ROC曲线下面积; CI，置信区间; CRISP，跨行业标准过程; CRP，C反应蛋白; CS，置信度评分; CXR，胸部X线检查; DT，决策树; ESR，红细胞沉降率; FP，假阳性; FN，假阴性; GBT，梯度提升树; K-NN，K-最近邻; LR，逻辑回归; MCV，平均红细胞体积; N，阴性; P，阳性; RF，随机森林; ROC，受试者工作曲线;SE，堆叠封装;支持向量机; TB，结核分枝杆菌; TP，真阴性; PTBDSS，肺结核诊断支持系统; TN，真阴性; WBC，白细胞。∗ 通讯作者。电子邮件地址：afa011@latech.edu（A. Farahani）。https://doi.org/10.1016/j.susoc.2022.06.002接收日期：2022年1月22日;接收日期：2022年4月26日;接受日期：2022年6月1日2022年6月3日在线发布2666-4127/© 2022作者。由Elsevier B.V.代表KeAi Communications Co.出版，这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）可在ScienceDirect上获得目录列表可持续运营和计算机期刊主页：http://www.keaipublishing.com/en/journals/sustainable-operations-and-computers/A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）30330445天[6]。一项研究报告说，结核病检测的中位诊断延迟时间为9.9周[7]。一些结核病症状可能发生在其他疾病中，这些疾病会影响肺部。肺炎是由细菌、病毒或真菌引起的肺部感染它表现出与肺结核（PTB）相似的症状[8]。传染病专家通过实验发现，结核病和肺炎被错误地互换诊断。Pinto等人证实误诊是常见的[8]。因此，区分结核性肺炎和非结核性肺炎会导致治疗延误治疗延迟导致患者生存率降低、治疗成本增加和治疗时间间隔延长。以前的研究表明，使用机器学习算法的人工智能有助于快速准确诊断结核病[6，9，10]。机器学习为定位数据集中隐藏的模式提供了有用的工具，这可以导致发现有价值的研究人员在预测结核病和肺炎以及鉴别诊断结核病方面取得了显著的成绩机器学习方法，如人工神经网络[6，11-17]，决策树[18，19]，ANFIS[6]，K-最近邻[20]，支持向量机[20]，逻辑回归[21]和随机森林[22]用于区分。据我们所知，在以前的研究中尚未考虑过基于机器学习方法区分结核病和肺炎。因此，本研究的主要目的是提出一种结核病和肺炎的鉴别诊断方法。此外，以前的大多数研究都在数据集上训练了单个分类器来预测结核病，肺炎和/或结核病与其他疾病之间的差异。单个机器学习模型可能是患者子集的良好估计器;然而，它们可能会发生过度拟合或拟合不足，这可能会降低它们的泛化能力。Encoder分类器可以通过组合不同单个分类器的结果来提高预测性能[23]。以前的研究使用不同基础分类器的集成分类器来预测卵巢癌[24]，肾结石类型[25]，癌症的分子水平特征[26]等。具有良好效果的新一代集成分类器是[27]第27章：我的世界它们由多层集合组成，可以显著提高分类性能[28]，并已应用于医疗保健预测[29]。SE基于元学习器从基本分类器的输出中学习，并且它们为元学习器提供更高的泛化能力[27]。因此，在这项研究中，我们提出了一种用于区分结核病和肺炎的堆叠集成分类器，并将其性能与其他常见和流行的集成分类器进行了比较，包括随机森林[30]，Adaboost[31]和梯度提升树[32]，以及包括决策树[33]，逻辑回归，支持向量机[34]和K-最近邻[35]在内的单一分类器。在之前的研究中，诊断结核病和肺炎时考虑了不同的特征，包括初步检查和实验室检查结果[11，12]、患者症状和TB风险因素[21]、人口统计学特征（性别和年龄）以及从CT扫描图像中提取的放射学特征[20，36，37]。血清学检测是结核病检测的良好预测指标，但一些结核病感染患者可能有一个负面的涂片测试[38]。在2013年的一项研究中，Yoon等人表明，中性粒细胞-淋巴细胞计数比率可以作为准确诊断肺炎或TB的有用测试[39]。对其中一种疾病的治疗可以使诊断更加准确另一个人例如，在结核病流行的地区，治疗肺炎患者可能会延迟结核病患者的诊断[40]。Liu等人使用MRI图像和深度学习肺炎与肺结核的鉴别诊断[41]。神经网络和胸部X射线图像被用于提出肺炎和结核病鉴别诊断的框架[42]。另一项研究描述了1 - 17岁结核性肺炎患者的临床和微生物学特征、放射学模式和治疗结局[43]。Wei等人每-形成了一项研究，以明确诊断急性结核性肺炎（TP）与社区获得性肺炎[44]。结核性真菌性肺炎（OFP）被认为是艾滋病患者死亡的主要原因，为了区分OFP与结核分枝杆菌复合群（MTBC），Bernal-Martínez等人使用多重实时PCR（MRT-PCR）和扩增后熔解曲线分析（MC-PCR）[45]。Wang等人使用多层螺旋CT图像和深度学习自动检测肺结核[46]。采用中性粒细胞-淋巴细胞比率（NLR）和单核细胞-淋巴细胞比率（MLR）鉴别诊断儿童肺结核和社区获得性肺炎[47]。卷积神经网络（CNN）用于诊断活动性肺结核（APTB）与社区获得性肺炎[48]。另一项研究调查了与细菌性肺炎相似的非典型肺结核（aPTB）的临床特征[49]。一项研究表明，COVID-19的出现影响了中低收入国家的结核病控制[50]。COVID-19和结核病有一些共同的临床体征和症状，加纳的一项研究重点关注COVID-19疑似病例中结核病的诊断[51]。在另一篇研究论文中，Sarınolu et al.显示重叠肺结核和COVID-19等呼吸道疾病可能导致疾病诊断和治疗延迟[52]。另一项研究表明，患者可能同时感染结核病和COVID-1，19.考虑到结核病的性质，他们假设研究中的所有患者在发生COVID-19感染之前都已经有活动性结核病感染[53，54]。在另一项研究中，计算机断层扫描（CT）用于区分COVID-19肺炎与社区获得性肺炎[55]。Jin等人使用胸部X线和集合方法对COVID-19和普通病毒性肺炎进行鉴别诊断[56]。胸部CT扫描特征用于区分COVID-19与肺炎链球菌肺炎[57]。Liu等人使用CT扫描诊断COVID-19和社区获得性肺炎[58]。另一项研究显示，COVID-19与其他肺炎和结核病具有相似的临床症状[59，60]。本文介绍了一个名为Pneumonia-本文提出了一种基于层叠集成模型的结核病诊断系统（PTBDSS），它可以通过早期诊断和最终决策两个步骤来区分结核病和肺炎。PTBDSS有两个步骤。第一步旨在根据低成本特征（包括人口统计学特征和患者症状）进行早期诊断。为此，设计了一种堆叠集成分类器。在第二步中，PTBDSS根据实验室测试结果、胸部X光报告和在第一步中提取的Meta特征确定最终诊断。在此步骤中，附加分类器的集成层到第一步所提出的诊断方法的主要优点是防止治疗延迟。根据PTBDSS第一步确定的诊断，患者可以立即开始治疗。用于早期诊断的特征成本低，可以由医生在他们的办公室迅速测量。之后，为更有把握，会要求潜在受感染患者进行实验室检查及胸部X光检查，并根据实验室检查结果、胸部X光报告及其早期诊断Meta特征作出最终决定。对可疑患者作出最终决定本研究的主要贡献概括为：（a）提出了一个基于低成本特征的肺结核和肺炎早期诊断决策支持系统。这避免了由于等待实验室结果和放射学报告的长时间而导致的延迟。(b)提出一种方法来识别潜在的感染患者，并要求进行实验室检查和胸部X光检查，以提高诊断的准确性。(c)提出了一种用于早期诊断的叠加集成方法，基于人口统计学特征和患者症状的SIS。(d)提出了一种用于最终决策的层叠集成方法，A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303305实验室检查结果、胸部X光报告和第一步方法提取的第二部分介绍了本研究中的数据特点和所提出的方法的主要步骤。实验的结果，包括模型的性能指标，在第3节中报告并与其他分类器进行比较。结论性意见和未来工作机会见第4节。方法本文介绍了A部分是跨行业数据挖掘过程（CRISP）方法学，这是一种用于规划数据挖掘项目的结构化方法。CRISP是数据挖掘项目中众所周知的一种强大的方法[61，62]。B部分由B1和B2两部分组成。在B1中，诊断是基于病人的症状而不是住院和人口统计学属性。这是我们分类模型的第一步。如果大多数分类者不同意一个标签（肺结核或肺炎），那么我们就进行第二步，即B2。在第二步（B2）中，我们使用在第一步中提取的Meta特征、实验室检查结果和从胸部X射线中提取的关键词。在B2中，最终类别标签被分配给患者。数据收集和描述就所收集的数据而言，各患者记录的疾病类型由专家社区根据痰涂片测试、痰培养及胸部X线摄影识别。从研究中排除了专家对其疾病类型存在高度分歧的患者病例。在此过滤后，199名患者被认为是本研究从伊朗阿拉克一家医院的传染科收集了诊断为肺结核和肺炎的患者的病历。数字特征的特性在表1中列出。白细胞计数的正常范围为4.5至11（约109/L）。血红蛋白的正常范围被认为是13.5至17.5克每分升。此外，红细胞压积的正常范围将在40%至50%之间。对于C-反应蛋白：（CRP），我们预计其范围为0.3至10，健康的人男性患者的红细胞沉降率（ESR）范围为0-22，女性患者为0-29[63个]表1显示了数值特征的分布，包括整个数据集以及诊断为肺炎和结核病的患者的平均值、标准差、中位数、最小值和最大值。表2列出了本研究中考虑的二元特征的分布。有119名患者被诊断为肺炎，80名患者被诊断为结核病。表2中的每一行都表示一种症状的存在每种疾病的患者。“是”表示患者表现出症状，“否”表示患者未表现出该症状。有时候，这些数字的总和不等于199，这是由于缺少值。为了更方便起见，一些二进制特征的直方图如图所示。二、图2显示了数据的探索性分析，并描述了当数据根据患者表现出的不同症状进行划分时，结核病和肺炎是如何分布的。例如，在左上角，显示了肺结核和肺炎患者的人数。患者在住院时表现出的所有症状如图2所示。分裂特征（症状）显示在每个博该条形图显示了肺炎和结核病患者的常见症状，以及每种症状在每种诊断中出现的频率。活动性结核病和肺结核的两种常见诊断测试是痰涂片测试和痰涂片培养，但一些挑战减少了这些测试的有用性一是部分表1从患者病历中提取的数字特征列表特征名称肺炎患者的分布总经销结核病患者的分布Min153.025.822.255.788- 十二点三十一分0.77是说61.938.5713.2240.7185.8370.8322.341.9635.13中值677.712.940.185.667220227Max10227.365.25151.66102.58105.2778.46.55124STD23.333.704.6410.526.6112.8311.531.4529.09Min153.65.822.255.784040.778.26是说61.118.3613.3140.7585.3969.9123.341.8827.62Max10219.219.2655.7100.293534.9198中值647.713.2540.9685.537021.83220STD23.773.082.225.696.5611.910.711/4522.72Min173.027.9528;261.428- 十二点三十一分0.11中值687.6512.0538.8286.5673.520237是说63.048.8713.0840.6586.5072.2220.842/0746.31STD0.234.476.8215.146.6714.06812.591.4633.74Max9427.365.25151.66102.58105.2778.46.55124年龄白细胞（WBC）血红蛋白红细胞压积平均红细胞体积（MCV）C反应蛋白：（CRP）红细胞沉降率（ESR）A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303306表2本研究中考虑的二元特征。特征名称总对于患有肺炎的对于肺结核疾病类型19911980性别女性：91，男性：108女：58，男：61女：33，男：47咳嗽否：7，是：192否：7，是：112否：0，是：80痰是：153，否：46是：87，否：32是：66，否：14血痰否：185，是：14否：112，是：7否：73，是：7发烧否：81，是：118否：47，是：72否：34，是：46特征名称总对于患有肺炎的对于肺结核摇动否：126，是：73否：57，是：62否：69，是：11吸烟否：175，是：24否：103，是：16否：72，是：8关节疼痛否：195，是：4否：119，是：0否：76，是：4水肿否：177，是：22否：105，是：14否：72，是：8哮喘否：85，是：114否：45，是：74否：40，是：40糖尿病否：167，是：32否：103，是：16否：64，是：16发绀否：195，是：4否：117，是：2否：78，是：2减肥否：171，是：28否：114，是：5否：57，是：23弱点否：155，是：24否：95，是：24否：60，是：20肺音正常：163，异常：36正常：118，异常：1正常：45，异常：35呼吸困难否：169，是：30否：100，是：19否：69，是：11端坐呼吸否：181，是：18否：103，是：16否：78，是：2CXR中的肺部异常否：5，是：174否：1，是：109否：4，是：65CXR中的白色斑点（斑点）否：9，是：166否：1，是：103否：8，是：63患者难以提供痰样本，痰样本通常在患者“咳出”痰时收集。此外，这些测试是昂贵的，结果往往来得很慢。此外，结果的准确性取决于提供的痰液样本的质量[64]。痰涂片检查也容易产生假阴性结果，这进一步说明了这种诊断工具的低效率。此外，一些感染，如艾滋病毒，可能导致假阴性，结核病的诊断[65]。最终诊断和疾病类型由社区专家根据痰涂片检查、痰培养、胸部X线检查和临床症状进行。痰涂片测试及痰涂片培养的结果主要与其他描述符一起由专科医生用于诊断疾病，并不包括在输入特征中。平衡取样为了保持和评价机器学习方法的泛化能力，应该将数据集划分为不重叠的训练和测试数据集。培训及测试数据集将分别用于培训分类器及评估经培训分类器。本文对建筑物进行了平衡抽样[66 训练数据集，以避免大多数类偏见。平衡抽样从每个类中选择相同大小的样本。数据准备和清理在收集数据之后，必须对其进行预处理，以便应用机器学习技术。在本文中执行的预处理任务包括离群值检测和删除，数据转换，缺失值填补。通过与领域专家的交互和box-plot分析来检测离群值。离群值是位于box图须线之外的数据点[67]。名义特征被转换为新的二进制变量，并且使用最小-最大归一化方法将序数和数值特征归一化为[0，1]如果没有归一化，大规模特征将主导其他特征[67]。具有高缺失值率（超过30%）的特征被排除在研究之外。非对称二元特征的缺失值插补是通过与领域专家的交互来执行的。对于其他属性，K-最近邻方法用于缺失值填补[68]。基于训练数据集的PTBDSS的主要步骤如图1（右）所示。第一步旨在基于低成本特征早期诊断肺炎中的结核病，并为每位患者分配一个置信度评分。之后，对于置信度评分较低的患者，要求进行一些实验室检查和胸部X线检查。在PTBDSS的第二步中，根据他们的结果进行最终诊断。每个步骤的更多细节描述如下。PTBDSS的第一步是基于低成本特征的作为输入变量，有助于PTBDSS第一步的特征包括人口统计学特征（性别和年龄）和患者症状（咳嗽、发热、痰、血痰、颤抖、关节疼痛、水肿、哮喘、糖尿病、发绀、体重减轻、虚弱、呼吸困难、端坐呼吸、肺音正常或异常、吸烟或不吸烟）。所考虑的症状见于结核病或肺炎患者。PTBDSS的第一步的输入特征是快速和低成本的，因为它们可以由患者描述或通过医生办公室的临床检查确定和测量。因此，它们的测量具有较低的财务成本，并且可以快速执行，而无需实验室测试中固有的等待。PTBDSS第一步的框架及其附加细节如图3所示。我们展示了Meta功能是如何创建的，以及如何大多数人投票将最终标签分配给每个患者。简而言之，每个Meta特征是5个标签的向量。每个标签不是肺炎就是肺结核。五名不同的分类员接受了人口统计学特征和患者症状的培训。然后，使用每个分类器预测每个患者的标签，并将这些标签放置在向量中。显示每个患者的标签预测的向量被认为是Meta特征。有关这一过程的进一步信息见图10。3.第三章。图3显示了具有两层的堆叠集成分类器。所提出的堆叠集成分类器的第一层显示在左手边。在这一层中，有人口统计特征和符号用作5个不同分类器（KNN、LR、SVM、DT和RT）的输入。每个病人都被所有分类器标记为肺结核或肺炎。例如，分类器KNN为patient1分配一个标签（TB或肺炎），并将该标签分配到MF 11的第一行。然后，线性回归（LR）分类器分配一个标签（结核病A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303307=��∑Fig. 1. 提出的方法框架（PTBDSS）A）基于CRISP方法的数据挖掘管道B）提出的决策支持系统（PTBDSS）的框架和体系结构。或肺炎），并将分配的标签放置在在列MF12的第一行中。对同一个病人继续进行相同的过程，直到所有分类器为MF13、MF14和MF15的第一行分配标签。当所有患者从所有分类器获得标签时，我们将列MF11绑定到MF15。因此，对于每个患者，我们将有一个标签向量，我们称之为“Meta标签1”。Meta特征1是由5个不同分类器为每个患者分配的标签向量。在第二层（图3的右侧）中，每个分类器的输入是Meta特征1（在第一层创建）。每个分类器分配根据第一步中创建的Meta特征为每个患者（肺结核或肺炎）添加标签。然后重复与层1类似的相同过程，这样将使用5个不同的分类器创建标签向量。这个新的载体被称为然后，在聚合步骤中，通过使用多数投票方法，并基于在“Meta配置2”中创建的标签，为步骤1选择最终标签。该标签是所提出的方法（PTBDSS）的第一步的结果。这是第一步中每个患者的最终标签，基于人口统计学特征和住院时的症状。基本分类器（K-NN、LR、SVM、DT和RF）的输出， SE的每一层被认为是Meta特征。在第一层（Meta Features 1）中生成的Meta特征被馈送到SE的第二层作为其输入特征。在第二层中，在Meta Fea- tures 1上训练基本分类器之后，基于投票方法聚合它们的输出并用于早期诊断。为了在早期诊断步骤中对每个患者的决策具有一定的置信度，需要置信度评分例如，当所有分类器为患者分配相同的类别标签时，疾病诊断将以最高的如果只有一半的基本分类器分配相同的标签，则显示该患者的疾病检测的最低在以前的研究中，已经定义并使用了不同的置信度分数进行半监督分类。具有较高置信度分数的未标记数据被分配一个标签并添加到训练数据集[70]。在本研究中，计算每例患者疾病标签的严格置信度评分（CS），如公式Eq. （一）.CS与基本分类器之间的分歧程度呈负相关：如图 3、一个堆叠的集成分类器是在（）下一页|∑{��∶��（��=��|��）>��）}1 −∑{��∶��（��=��|��）>��）}|输入特征，它有两层集成方法。先前CS��|关于我们|��（一）研究表明，集成分类器具有更高的精度，[27]当他们在一起的时候，|��）��>��）��|��) > ��) 1 + ∑��∶��（��=��|��）>��）|对于在合奏分类器的主体中选择分类器的良好组合，类似于Kazemi和S。Mirrosandel[25]，在本研究中对几名分类器进行了培训和评估。为此，随机选择约30%的数据集作为定义数据集，并选择在该数据集上具有最佳性能的分类器。第一步中提出的SE的两层都使用K-最近邻（K-NN），逻辑回归（LR），支持向量机（SVM），决策树（DT）和随机森林（RF）作为基本分类器。它们是使用Python库Scikit-learn（版本0.21.1）实现的。其中Pi是患者i，Cj是第j个基本分类器，PCj（y=TB| Pi）是由Cj和PCj将Pi分配给类别TB的概率（y=P| Pi）是通过Cj将Pi分类为肺炎的条件概率。CS在0和1之间变化。如果所有的基本分类器都给一个病人分配了相同的类别标签，那么CS将具有最大值。最低CS当一半的基本分类器将相同的标签分配给患者时，可以获得。我们将对CS应用阈值，以识别置信度评分低的患者。这些患者在本文中被称为一些补充资料是A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303308图二. 二进制特征的条形图。A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303309++图3.第三章。所提出的方法（PTBDSS）的第一步更详细。提高患者对疾病诊断的信心。因此，在PTBDSS的第二步中，需要对他们进行一些实验室检查和胸部X线检查。PTBDSS最终决策的第二步PTBDSS第二步的输入特征包括结果实验室检查和从胸部X射线报告中提取的关键词。实验室检查包括白细胞（WBC）、血红蛋白、红细胞压积、中性粒细胞、淋巴细胞、平均红细胞体积（MCV）、C反应蛋白（CRP）和红细胞沉降率（ESR）。PTBDSS的第二步的框架与更多细节在图4中示出。在第二步中，遵循与第一步相同的逻辑来创建Meta特征。在第二步中，输入是从第一步获得的实验室测试和Meta特征。五名分类器接受了这些输入的培训，他们每个人都预测了每个患者的标签，无论是肺炎还是结核病。该步骤的结果是另一个5个标签的向量，考虑到5个标签并使用多数投票，最终标签被分配给每名患者。图4示出了所提出的堆叠系综的第二步骤更详细地说在此步骤中，实验室测试结果和Meta特征减少误差图5示出了在所提出的模型（PTBDSS）中用于降低结核病和肺炎的鉴别诊断的错误率的工作流程。如上图所示，有两个诊断水平。当人口统计学特征和患者症状用于训练分类器并且预测结果的置信度评分可接受时，发生早期诊断。在这种情况下，早期诊断被接受。如果模型产生了早期诊断，低置信度评分，然后使用Meta特征和实验室结果来更准确地预测每个患者的疾病标签（肺炎或结核）。模型在第二步中预测的标签是在早期诊断步骤中未被诊断的患者的最终诊断。关于如何计算置信度评分的进一步解释见表7。结果为了评估和验证所提出的用于区分肺结核和肺炎的模型，需要计算一些性能指标，包括准确度、精确度、召回率、F-评分和ROC曲线下面积（AUC）。准确性计算有多少数据记录被正确分类为Eq。（二）：从第一步骤（Meta配置2）的第二层获得的是用作5个不同分类器的输入。分类器的输入为��=��+��（二）实验室检测结果和Meta分析2.然后每个分类器分配每个患者都有一个标签（肺结核或肺炎），因此每个患者都有一个新的标签向量。最终标签被分配根据MF 31至MF 35中创建的标签的多数投票，向每名患者提供。该标签将是所提出的方法（PTBDSS）的第二步骤的结果，并且该标签将是最终类别标签（结核病TP和TN是真阳性和真阴性数据记录，N是所有数据记录的数量。阳性和阴性分类分别为结核和肺炎。精确度测量了预测的正实例中的实际正实例的分数，如等式(3).或肺炎）。由K-NN、LR、SVM、DT和RF组成的集成分类器是��=��（三）第二步训练。输入特征包括实验室测试的结果、从胸部X射线报告中提取的关键字以及从堆叠集合的第二层中提取的Meta特征Recall表示有多少属于正类的数据记录被正确分类为Eq。（四）：模型（Meta Features 2）在PTBDSS的第一步。在这一步中，通过对基本分类器的输出进行多数表决来进行最终决策。��=��FP和FN是假阳性和假阴性数据记录。（四）A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303310+图四、所提出的方法的第二步（PTBDSS）更详细。F-Score是精确度和召回率的调和平均值，如等式（五）：��−��ROC（受试者工作曲线）是一个概率图，通过改变阈值显示二进制分类器的区分能力。AUC测量ROC下的面积。它告诉我们模型可以在多大程度上区分类。AUC越高，模型在预测两个类别方面越好。为了评价和验证所提出的方法，考虑了人口统计学特征、患者症状、实验室检查和X射线报告的结果以及PTBDSS第一步中出现的Meta特征的不同组合，如表3所示。本研究中使用了不同的特征集来评估分类器。如下表所示，每个功能集都是不同输入的组合。例如，FS 2是实验室测试结果和从胸部X射线图像报告中提取的关键字的组合。本研究中使用的评价框架见用于评估PTBDSS模型早期和最终诊断性能的框架如图6的部分（a）和部分（b）所示。例如，在部分（a）中，FS 1（住院时人口统计学特征和患者症状的组合）用作输入。然后，在此输入上训练不同的分类器。不同分类器的性能与PTBDSS模型的性能进行了比较。选择DT、LR、RF、SVM、Adaboost和GBT是因为这些分类器被认为是黄金标准分类算法。图 6，部分（b）我们有5个不同的特征集，称为FS 1-FS 5。如图6、本研究采用的评价框架包括：包括两个模块（a）和（b）：- (a)结核病和肺炎早期鉴别诊断的评价框架：○ 只有人口统计学特征和患者症状作为输入变量提供给分类器第一次的表现A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303311图五、-所提出的模型（PTBDSS）中使用的工作流程，以减少误差。表3特征集的描述。功能集名称包括的功能FS1症状和人口统计学特征功能集名称包括的功能FS2实验室检查结果和从胸部X线图像的放射学报告中提取的关键词通过所提出的早期诊断模型获得的FS3 Meta特征（Meta特征2）FS4 FS2和FS3FS5 FS1和FS2图六、本研究中使用的评估框架。A. Farahani，T. Khatibi，H. Sarmadian等人可持续运营和计算机3（2022）303312表4根据症状和人口统计学特征比较不同分类器在结核病和肺炎早期鉴别诊断中的表现，CI 95%（FS 1）。模型精度AUC精度召回F-score决策树89.00±2.6984.58±2.5880.23±2.4194.17±2.3686.64±2.42模型精度AUC精度召回F-scoreLR87.50±2.9386.46±2.3678.79±2.2991.67±2.7384.75±2.03SVM87.75±2.8686.41±2.3678.53±2.1793.12±2.4585.20±2.91RF89.5±2.8588.85±3.9682.30±2.4092.08±2.3286.92±2.43AdaBoost86.12±2.0585.74±2.8876.25±2.5292.01±2.2783.39±2.35GBT85.87±2.4384.65±2.9776.20±2.6691.18±2.4783.02±2.52PTBDSS第一步的第一层90.62±2.1989.58±2.3283.61±2.7995.23±2.7088.49±1.79PTBDSS第一步的第二层91.37±2.0890.26±2.3083.61±2.6196.04±2.2789.39±2.56表5根据FS 4中的特征，比较不同分类器在结核病和肺炎最终鉴别诊断中的性能，CI 95%模型精度AUC精度召回F-score决策树92.54±1.1591.45±1.3788.10±1.4692.84±2.1790.41±2.02LR92.48±1.4591.43±1.6588.10±2.5392.66±1.1090.32±1.93SVM92.66±1.7791.91±2.3188.29±2.7692.95±2.3590.56±2.61AdaBoost91.39±1.4090.22±1.4686.52±1.0791.52±1.5988.95±1.13GBT90.81±1.0890.06±1.8486.15±1.9590.25±1.8888.15±1.92RF92.67±2.1291.87±2.4088.42±2.0892.80±1.9790.56±2.21PTBDSS的第二步93.96±2.8192.81±2.7290.63±2.6193.75±2.0392.16±2.38表6比较不同分类器在结核病或肺炎最终鉴别诊断中的性能，CI 95%基于不同特征。特征模型精度AUC精度召回F-scoreFS2DT87.50±1.1382.50±0.9978.39±1.3292.50±1.0884.86±1.25LR88.05±1.0384.87±1.0178.87±1.1293.50±0.9585.56±0.98SVM88.20±1.2684.87±1.2279.57±1.2692.62±1.3385.60±1.27AdaBoost85.00±1.5781.76±1.3975.63±1.1989.11±1.6181.82±1.46GBT84.43±0.9280.88±0.8875.98±1.1788.32±0.7281.69±1.04RF89.00±1.1885.04±1.1881.48±1.2291.83±1.0686.35±1.12FS3DT90.18±1.9189.33±1.2784.07±2.0191.39±1.3087.58±1.77LR90.66±1.7289.40±1.1784.55±2.1492.18±1.6588.20±1.82SVM91.45±1.5989.69±2.4285.66±1.8593.00±1.5489.18±1.59AdaBoost91.08±1.2689.45±1.4985.32±1.6492.34±1.6088.69±1.63GBT90.02±1.5589.21±1.2483.27±2.4692.17±1.4187.49±1.78RF91.03±1.0889.63±1.5184.61±2.0193.28±1.1888.74±1.59FS5DT88.5±1.2889.12±0.9979.07±1.7594.71±1.0186.19±1.42LR89.67±1.5387.54±1.6481.10±1.9294.83±1.8487.43±1.87SVM90.00±1.0390.09±1.6280.60±1.3391.83±0.9085.85±1.08AdaBoost87.33±2.6586.17±1.5479.28±1.0790.10±2.1984.34±1.64GBT85.5±2.1484.45±2.1876.24±3.2289.67±1.2582.41±2.52RF90.02±1.2389.75±2.0783.31±2.3092.11±0.8087.49±1.58将PTBDSS的步进模块与DT、LR、SVM等单分类器和RF等集成方法进行了比较。 Ad-aboost 使用 Python 库 Scikit-learn （版本0.21.1）实现，梯度提升树（GBT）使用具有Python包装器的Microsoft软件“LightGBM”实现比较结果列于表4中。- (b)最终决策的评估框架○ PTBDSS的第二步通过喂养FS4来训练。FS 4特征包括PTBDSS第一步提取的Meta特征（FS 3）、实验室检查结果和胸部X射线图像放射学报告中的关键词（FS 2）。PTBDSS的第二步的性能与DT，LR和SVM等单一分类器以及RF，Adaboost和GBT等集成方法进行了比较。输入到比较分类器的输入特征是FS 1、FS 2、FS4或FS 5的特征。该等分类器的表现指标载于表5及表6。如表4所示，PTBDSS性能的第一步是与几种可靠的分类算法相结合表4显示P

下载后可阅读完整内容，剩余1页未读，立即下载