基于进化算法的肝活检图像脂肪变性患病率分类和量化的自动分析方法

134 浏览量更新于2023-12-05 收藏 1.47MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

阵列11（2021）100078基于进化算法的肝活检图像脂肪变性患病率分类和量化的AlexandrosArjmand a，**，Vasileios Christou a，Ioannis G. Tsoulos a，Markos G. 齐普拉斯b，亚历山德罗斯·TTzallasa，*，Christine Gogosa，Euripe Glavas a，Nikolaos Giannakeas a，*a约阿尼纳大学信息学和电信学院，信息学和电信系，希腊阿尔塔，科斯塔基奥伊，GR，47100b西马其顿大学电气和计算机工程系，GR，50100，Kozani，希腊A R T I C L EI N FO保留字：肝活检脂肪性肝炎脂肪肝图像分析机器学习进化算法语法进化A B S T R A C T非酒精性脂肪性肝病（NAFLD）涵盖了一系列慢性医学病症，从以非酒精性脂肪性肝炎（NASH）为特征的肝细胞炎症到作为非酒精性脂肪性肝（NAFL）的关键要素的脂肪变性。它在全球范围内与肥胖和代谢综合征其他组分的患病率增加有关，预计将成为未来几年肝病存在的主要指征。由于临床诊断困难、发病机制复杂、缺乏有效的治疗方法，其根除已成为一个重大挑战。在这项研究中，提出了一种自动图像分析方法，提供定量评估脂肪变性肝活检标本中的脂肪沉积。该方法应用了图像处理、机器学习和进化算法优化技术，与专业肝病学家的半定量解释相比，平均分类误差为1.93%。1. 介绍非酒精性脂肪肝（NAFLD）是全球慢性肝病的一个日益增长的原因[1]。其主要特征是肝脏组织中的过度脂肪沉积，这不是由于饮酒，而是由于肥胖，胰岛素抵抗和代谢综合征等风险因素。虽然其他疾病如脂质代谢遗传性疾病也可引起肝脏脂肪沉积，但与上述风险因素相比，它们的发生频率要低得多。NAFLD也可以发展为非酒精性脂肪性肝炎（NASH）。NASH发展为肝硬化的风险显著高于NAFLD，这会导致进一步的失代偿，导致一些个体的肝移植甚至死亡。一般来说，NAFLD与肝细胞癌（HCC）密切相关[2]，通常认为肝细胞癌出现在肝硬化或长期慢性乙型肝炎（CHB）感染后。基于横断面数据的估计显示，20可能达到NASH肝硬化的终末期。虽然纤维化的分期对于监测肝硬化进展的临床风险是重要的，但是脂肪细胞的定量积累的有效评估对于药物治疗的早期开始是极其重要和必要的。尽管已经开发了许多非侵入性成像技术，但是通过活检样本数字化的肝组织成像已经成为临床诊断的金标准。针吸活检标本通常包埋在4μ m厚的切片中，并根据病理情况用几种组织学染料染色，包括苏木精-伊红（HE）、Masson三色和天狼星红。随后，通过数字显微镜进行成像可以准确预测几个关键的肝脏发现，包括胶原比例面积（CPA），表明纤维化，组织炎症，气球样变性和脂肪变性。在早期，NAFLD检查包括对肝活检的主观显微镜解释，通常导致称为观察者间或观察者内变异性的临床障碍，指的是即使在专家医生之间的诊断分歧。为了克服这个问题，* 通讯作者。** 通讯作者。*** 通讯作者。电子邮件地址：k. uoi.gr（A.Arjmand），b. uoi.gr（V. Christou），itsoulos@uoi.gr（I.G.Tsoulos），mtsipouras@uowm.gr（M.G.Tsipouras），tzallas@uoi.gr（A.T.Tzallas），cgogos@uoi.gr（C.Gogos），eglavas@uoi.gr（E. Glavas），giannakeas@uoi.gr（N.Giannakeas）。https://doi.org/10.1016/j.array.2021.100078日期：2021年6月6日;接受日期：2021年7月4日2021年7月16日在线提供2590-0056/© 2021作者。爱思唯尔公司出版这是一篇基于CC BY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）的开放获取文章。可在ScienceDirect上获得目录列表阵列期刊主页：www.sciencedirect.com/journal/arrayA. Arjmand等人阵列11（2021）1000782××××多年来的几项研究已经显示了通过计算机软件进行自动脂肪定量对于准确预测和排除假阳性结果的重要性。最初，Zaitoun等人[3]得出结论，苏木精和伊红（HE）是慢性丙型肝炎（CHC）患者体视学和形态计量脂肪变性定量的理想组织学染色剂。Marsman等人[4]证明，图像分析系统可以成功地自动测定肝活检标本中的总脂肪含量，因为诊断结果已被证明与病理学家的目视判读具有良好的相关性。Roullier等人[5]的研究依赖于组织样本区域和脂滴区域分割的像素强度值阈值。类似地，后来的研究[6，7]揭示了颜色均匀性可以是区分脂肪变性和其他非脂肪发现的决定性因素。Liquori等人的工作。[8]和Batool [9]提出了一种更有效的方法，即采用形态学算子消除非圆形对象（不指脂肪细胞）。Gianna-keas等人[10]和Nativ等人[11]的作品中提出的现代自动化方法强调了将无监督机器学习（聚类）和主动轮廓建模（ACM）技术相结合的重要性，旨在分割脂肪滴。 Sciarabba等人。[12]类似地提出了一种基于聚类的工具用于肝活检中的肝脂肪变性评估。建议的汽车-然后，mated工具能够通过2级阈值和三个形状参数（坚固度、伸长率和粗糙度）来识别脂肪滴。Homeyer等人[13]使用邻接统计作为形状特征来识别组织学图像中的脂肪滴。Roy等人[14]提出了一种结合圆形脂肪细胞的分割和分类以及重叠脂肪变性成分的分离的对象检测方法。Vanderbeck等人提供了一项全面的[15]，其中通过监督机器学习算法分析专家病理学家在随后的研究中[16]，同一组对肝细胞气球样变的检测做出了重大贡献。这种情况目前是医生临床关注的中心Ishikawa等人[17]提出了一种分析染色肝脏图像的方法，该方法可以将脂肪滴和窦状隙与基质分离。Liu等人[18]提出了qFIB自动化工具，旨在通过组织学评价量化非酒精性脂肪性肝炎（NASH）模式的传播。所提出的工具基于对关于以下主要组织病理学特征的特定参数的分析：a）纤维化，b）炎性，c）纤维化，d）纤维化。c）肝细胞气球样变和d）脂肪变性。Yip等人[19]使用了四个机器学习方法（逻辑回归，岭回归，AdaBoost和决策树）用于检测NAFLD。他们的实验结果表明，使用Logistic回归和岭回归的模型Teramoto等人[20]使用拓扑数据分析方法结合机器学习方法将组织图像分类为NAFLD亚型。所提出的算法利用Matteoni分类系统从肝组织活检Vicas等人[21]依赖于CNN图像分析方法，U-Net成为脂滴分割的最佳深度模型。Yang等人[22]使用50，000张图像的大型数据集创建并训练了一个深度CNN，用于量化肝脏样本中的肝脏脂肪变性Guo等人[23]提出了Mask-RCNN方法，该方法基于深度学习，用于将肝脏脂肪变性液滴分割成团块。Mask-RCNN利用边界框检测，能够预测对象掩码。Han等人[24日]创建两一维卷积神经网络（CNN）利用从肝脏获取的原始射频超声数据。第一个网络用作检测NAFLD的二元分类器，而后者用作脂肪分数估计器。由于很少有多个肝病检测系统已经实施，目前的研究旨在分离四个解剖结构，以避免假阳性识别结果，从而可以提供用于估计肝脏组织中的总脂肪比率的可靠工具。从技术上讲，所开发的方法依赖于图像处理技术，用于确定肝脏组织区域和检测感兴趣的圆形物体。然后，该方法通过监督机器学习集中于4类识别问题，旨在区分脂肪细胞并从脂肪变性患病率计算中排除其他组织病理学改变。这四类是指1）脂肪滴，2）球囊细胞，3）窦状隙和4）静脉（图1）。因此，脂肪结构的准确表征可能导致在NAFLD患者中客观定量脂肪积累的临床试验。2. 方法总的来说，提出了一种三步方法，最终导致数字化肝活检样本中脂肪变性比率的计算在第一步骤中，应用全局阈值方法来分离一组图像中的背景像素和组织像素。20个测试图像，然后是一种递归形态学操作，用于消除非圆形白色物体。第二步侧重于在一组40张训练图像中对组织学结构进行注释。最后，这些注释训练一个监督分类器，该分类器将脂滴与其他环形组织解剖结构区分开来，从而可以计算脂肪变性的患病率。这种流行程度是指每20个测试图像的整个组织样本中脂肪的百分比。图2示出了所开发的方法的流程图。2.1. 组织区域和感兴趣对象分割第一阶段旨在识别20个测试图像中的整个组织区域。为此，应用有效的组织提取方法。更详细地，RGB组织学图像最初被转换为灰度，然后通过归一化所有8位方差值并将对比度限制设置在闭合的[0，1]间隔内来增加其对比度。然后调用Otsu方法来计算全局阈值，最终导致在输出的二进制图像中将组织学组织与其背景分离（白色像素→背景，黑色像素→组织）。然而，这一步骤是不够的，因为在大多数情况下，每个显微镜标本包括在从患者移除活检样本期间切除的非常小的组织学区域。这些不属于回收标本的主体，应该被排除在肝组织区域之外。根据这一观察，分割方法首先计算每个8连接像素像素区域（沿着水平、垂直或对角方向连接的同一对象的相邻像素）的面积。然后，将面积小于最大检测区域的3%的连接像素区域作为组织样本的一部分丢弃。结果，产生改进的二进制图像，通过该二进制图像设置活动轮廓以确定原始RGB活检图像中的分割的组织区域的实际边界。图1示出了具有绿色轮廓线的彩色源图像中的最终组织分割结果下一步骤尝试通过应用具有由5像素XEL半径值组成的圆形结构元素的形态滤波来检测分割的二元组织区域中的感兴趣的白色区域。更强调的是，循环内的形态学打开过程将圆形掩模的半径增加2个像素，以便不仅平滑每个滤波对象的边界，而且消除半径小于5个像素的不必要的伪影，其被认为是噪声。因此，仅包括表征脂肪细胞的纯圆形白色结构。最后，再次调用活动轮廓来检测每个过滤的圆形结构的边界，以及在初始RGB活检图像的绿色通道中计算它们的一系列组织学特征。该提取的特征向量在稍后阶段导致这些检测到的特征向量的分离。A. Arjmand等人阵列11（2021）1000783××=Fig. 1. 在灰度强度图像中通过Otsu阈值化的组织成分的EX牵引，所述灰度强度图像从初始RGB输入值获得并且从 HE组织学染色。下一步的重点是使用活动轮廓模型定位其区域边界。然后，分割的组织区域可以导致识别4种组织学改变，即：a）脂肪滴，b）球囊细胞，c）窦状隙和d）静脉。对象作为来自其他微观解剖结构的脂质细胞与经训练的分类器。2.2. 训练样本考虑到分类算法的训练，现在针对由专科肝病学家在40个放大图像中标注的感兴趣的组织学结构计算特征集。该集合构成与先前分割的测试图像中的过滤的20个圆形对象相同的特征向量。更具体地，该特征集涉及四个主要类别，使得可以区分上述四个肝脏类别之间的差异。这些包括感兴趣的物体的形状、纹理、位置和大小（表1），这些稍后作为输入被馈送到所提议的研究中分类算法2.3.1. 语法演变GE是进化算法（EA）的一个子集，在程序的自动创建中取得了显著的成功。具体而言，遗传编程（GP）是最知名的EA之一。GP使用Lisp编程语言作为其目标语言，尽管许多研究人员已经创建了一种专门用于他们试图解决的问题的本土语言[26GE是由O'Neill和Ryan提出的通用电气能够通过uti生成任何语言的程序，将这些二进制字符串格式化以选择产生式规则。这些规则是用巴科斯-诺尔形式（BNF）1语法编写的创建具有语法上有效的语法的程序，该语法经受使用适应度函数的评估。通用电气公司的灵感来自于生物学过程，基于表1，监督分类器D=（xi，yi）N受过训练，=遗传物质关于创造一个其中x=I1{偏心率，EX tent，长轴长度，短轴长度，蛋白质始于基因组，基因组由DNA组成，这些子组分又被转录成RNA密码子。这些平均强度、平均PIXel值、StDPIX el值、密实度、质心-X，质心-y，面积，直径，周长}表示输入特征向量，y∈{脂肪滴，气球状细胞，正弦曲线，静脉}表示输出标签，而i1，2.3. 分类方法本文利用Tsoulos等人提出的GenClass方法。[25]，这是一种基于语法进化（GE）的工具RNA密码子被翻译成氨基酸序列，形成蛋白质的结构单元。在其环境中使用这种进化过程产生的蛋白质形成表型[31]。在GE中，表型是使用由二进制字符串组成的基因组基因组被转换成1BNF是一种元语言（一种能够在语法上描述编程语言的语言），它能够指定可以创建语法有效程序的符号序列[30]。A. Arjmand等人阵列11（2021）1000784=图二. 自动诊断方法的流程图，包括图像分割和监督分类技术，以识别多个肝脏组织对象。最后的分类阶段导致整个活检载玻片图像中的脂肪比率计算表1从注释中删除特征。功能类别描述1基于形状的偏心率，EX tent，长轴/短轴长度2基于纹理的平均强度、平均值/StD像素值、坚固性3位置质心（X，y坐标）4幅值面积、直径、周长转换成一系列整数，这些整数被映射到预定义的规则上并形成计算机程序。从基因型到表型的映射过程是模仿生物学过程的许多过程之一，其中相同的遗传物质在不同的基因中被利用。 GE的目标是使用迭代进化过程使计算机程序适应特定问题的目标函数。这个过程受到生物学的启发，包括变异下降、突变、交叉、基因转录和基因表达等过程。出租车是从一套名为人口的计算机程序开始的。种群的成员被编码为子符号形式的二进制字符串，它们使用迭代过程进化。二进制字符串有不同的长度，它们被映射到一个结构良好的符号形式作为可执行的上下文无关语法（CFG）。这种文法是用BNF定义的，它被表示为包含终结符和非终结符的几个产生式规则。非终结符是可由终结符组替换的抽象符号根据产生式规则，而终端符号是特定的词汇元素。优化过程涉及从候选解决方案基因组中读取8位数据块（名为Condon），然后将其解码为整数。当读取过程到达字符串的末尾时，它会循环回到字符串的开头，以这种方式创建一个环形基因组。整数映射到BNF表达式，直到创建了语法完全正确的表达式这个过程可能不会使用解决方案的整个基因组，或者由于其循环性质，它可能会多次使用解码的基因组[31]。2.3.2. GenClassTsoulos等人[25]提出了基于GE的GenClass便携式工具用于分类问题。与最近的分类任务方法（包括多层前馈神经网络[32]和支持向量机（SVM）[33]）不同，GenClass可以使用GE [29]创建分类程序。GE过程需要目标语言的CFG（在GenClass中，目标语言以BNF格式表示CFG文法定义为G（N，T，S，P）。在这个公式中，N定义了一组非终结符，T定义了具有约束条件的终端符号的有限集合，- 是的最后两个符号是S和P，终止符号S被称为文法的开始符号，最后P符号定义了具有形式A→a或A→aB的产生式规则的有限集合，A，B∈N，a∈A. Arjmand等人阵列11（2021）1000785=××××T.算法1：GenClass1：开始搜索第二章：加载训练数据。第三章：设置最大代数（N G）。四：设置构成种群的个体数（N C）。第五章：设置选择速率（P S）。第六章：设置突变率（PM）。第七章：初始化人口的成员（PM）。8：结束第9章：开始进化10点整：对于i=1，11：为每个个体创建一个分类程序12：计算所有个体的适应度13：应用选择运算符。14：应用变异操作符。第15章：结束第16章：结束第17章：开始评估十八：为进化过程中选择的最佳染色体创建分类程序。十九：将程序应用于测试集并返回结果。第20章：结束在GE中，染色体被表示为包含整数的向量，其中每个向量的元素表示来自BNF语法的产生式规则。GE过程从语法的开始符号开始，遵循产生程序字符串的迭代过程。此过程将非终结符符号替换为所选产生式规则的右手。选择过程使用两步方法，其中使用公式（Rule V mod R）用所选产生式规则替换后续向量元素（用符号V描绘）。在此公式中，R表示当前非终结符符号的产生式规则数。重复这两个步骤，直到它产生一个有效的表达式或达到个人关于后者，个人被定义为无效的，这导致分配一个大的值，其相应的健身。GenClass方法在上面的算法1中描述3. 结果3.1. 材料和方法目前工作中使用的所有活检标本均采用金标准HE组织学染色染色，并来自人类亚细胞，其签署同意将其样品纳入实验研究，遵循赫尔辛基宣言的伦理原则。部分人群是指患有高脂肪变性患病率的NAFLD患者，而在许多情况下，在NASH进展个体中也观察到高肝细胞气球样变率。该数据集来自在圣玛丽医院（英国伦敦帝国理工学院医疗保健NHS信托基金）收集的病例，并使用Hamamatsu（日本滨松的滨松光子学）显微镜捕获。最初，数字化活检包括超过10，000个大小的一万像素因此，一个必要的步骤涉及这些图像的压缩，以有效地利用计算资源。特别是，目前的方法检查两个子集的肝脏活检图像。第一个包括13个训练图像，放大率为40，而第二个子集涉及28个测试样本，放大率为20这两种选择反映了真正的临床诊断程序，因为数字扫描仪需要识别不同尺度上的各种组织发现。为此目的，在一个封闭的[0，1]间隔的特征值的归一化是一个先决条件，为两个放大因子。现在重点放在40个训练图像中的组织学对象的注释上。图3示出了NDP。View 2软件环境，肝脏科医生可以使用徒手工具图三. NDP的介绍。View 2病理学软件，包括一系列图像可视化和感兴趣对象注释工具。对于当前的标注任务，采用具有不同边缘线颜色的手绘工具来选择训练样本。所选区域的边界坐标的详细信息记录在XML文件中。A. Arjmand等人阵列11（2021）1000786×××××=手动标注的脂肪含量白色区域（红色轮廓线）、球状肝细胞（黄色轮廓线）、血窦（绿色轮廓线）和静脉（蓝色轮廓线）。每个注释区域都是自动-以原始×40彩色图像中的二维图像（笛卡尔）坐标的形式自动导出到XML文件，同时由临床医生指定唯一的“id”和类别标签。在注释过程结束时，提供了总共7，305个训练样本，包括4，023个脂肪细胞，b）3，064个气球状区域，c）3，064个气球状区域。165个血窦和d）53个静脉，其中脂肪滴和气球样肝细胞构成训练样本的大部分。尽管这些数字表明有足够的训练集，但它们形成了一个不平衡的数据集，这是导致各种分类任务性能降低的常见障碍。作为解决方案，通过包括390个随机脂肪变性类对象和390个随机气球样变病例，同时保留所有165个窦状隙和53个静脉，对训练集进行了改造。基于表1，还在绿色通道中针对每个40训练图像计算四类对象中的每一个的特征向量。在此应当指出，对于 20和 40个图像子集在绿色通道中计算特征值，因为HE组织染色的粉红色调和四个被检查的解剖结构的纹理的差异更多地由RGB颜色空间中绿色通道的8位强度确定。为了验证特征值计算过程的正确终止，图4给出了最终注释结果的图示，其中输出的灰度图像具有与原始RGB组织样本相同的尺寸。可以观察到，每个注释的类区域以不同的灰度值显示，而彩色点指示计算的偏心点。3.2. 图像分割结果对于方法学评价，出于诊断目的考虑了20个放大样本的测试子集。首先，一个重要的先决条件涉及检查初始图像分割阶段的可视化结果。如图5所示，绿色活动轮廓线已会聚在所有感兴趣的圆形结构的边界，其表示单个脂肪滴的检测。所提出的图像分割阶段的成功还在于以下事实：大多数肝细胞气球样变以及大的非圆形白色区域（表明肝静脉和肝窦）的情况已经成功地从脂肪像素总数计算中排除。对于测试子集（n28）的每个图像，脂肪比率被计算为未知圆形类对象的总面积除以初始提取的组织区域（Fsegm）。该患病率也由圣玛丽病理学家（F doc）在四项发现分类阶段之前的半定量估计提供因此，这些百分比之间的差异表示每个分割活检图像的绝对误差，如下所示：Serr=|Fdoc-Fsegm|100%（ 1）3.3. 分类结果由于方法学扩展，医生的脂肪变性比率（F doc）评估与所提出的（FGE）分类阶段之间的绝对误差GEerr=|Fdoc-FGE|100%（ 2）根据综合方法，重点是最终诊断表（表2a和表2b）。更具体地，表2a中的第三列示出了在所有28个活检样本中，利用基于GE（FGE）的GenClass方法的分类阶段产生比Fsegm图像分割步骤（在第二列中）更低的脂肪变性百分比。需要强调的是，所提出的基于GE的GenClass方法将平均脂肪比率降低至0.27%（18.21%与18.48%相比）。平均值的降低来自于与图像见图4。每个先前注释的训练样本的边界和偏心率值的可视化。可视化过程发生在从原始RGB数字化活检导出的灰度图像上，而每个偏心点用根据注释边缘线颜色着色的点指示A. Arjmand等人阵列11（2021）1000787×××××图五. 图像分割阶段的可视化结果，其中执行具有绿色轮廓线的圆形脂肪滴的准确检测。然而，观察到用红色轮廓线标记的较大脂肪聚集区域，其指向重叠的脂滴区域。这种聚集现象是指放大倍数为20倍的限制，这会影响每个圆形物体边界的确定以及分级台的性能。分割阶段将被包括在脂肪比率量化中，已经被移除。接下来，第四列的结果显示了根据St. Mary医师的半定量评估（Fdoc）的所有脂肪比率百分比。这些视觉解释最终导致表2b的第二列和第三列，其中圆形结构分割及其分类为脂肪方法的绝对误差分别为计算每个×20肝活检图像。如下，平均值确定了分类方法的诊断误差（GEerr），并与图像分割估计产生的诊断误差（Serr）进行了比较。在此基础上，得出结论，GenClass算法的平均绝对误差为1.93%，小于2.08%的图像分割阶段。4. 讨论非酒精性脂肪性肝病（NAFLD）及其进展为非酒精性脂肪性肝炎（NASH）是全世界肝硬化和肝细胞癌（HCC）的主要原因，最终导致终末期肝病。NAFLD的患病率由脂肪变性的定量程度（脂肪滴在肝组织中的积聚）确定，无显著的坏死性炎症损伤，而NASH是指更复杂和活跃的病变，范围从组织炎症到肝细胞气球样变和坏死[34]。NAFLD和NASH并发症的这种谱阻止了准确的药物治疗的定义，这一障碍导致研究人员开发基于图像分析的自动量化和分期工具，其中组织学是最近临床试验中的金标准。目前的工作重点是解决视觉和亚视觉的问题通过构建一个自动化诊断工具，对NAFLD活检图像中的脂肪变性患病率进行准确量化，从而为医生提供客观诊断。在第一阶段中，图像分割方法从其背景中提取组织区域，然后在提取的组织内用活动轮廓检测白色圆形结构。该程序涉及28个活检图像，20倍放大，通过它计算一组特征值用于分类目的。在第二阶段，专家临床医生形成一个训练数据集，该数据集具有来自13张放大率为40倍的图像的注释样本。注释过程由四个组织学类别组成，即a）脂肪液滴，b）气球样肝细胞，c）血窦和d）静脉。最后一个阶段使用GenClass语法进化（GE）方法，该方法使用注释数据集进行训练。然后，调用经训练的系统对分割的20个圆形结构进行分类，以仅包括脂肪变性量化中的脂肪细胞在28个测试图像中。基于完整的方法，分类阶段提出了一个1.93%的平均脂肪定量误差，这表明在28个测试样本的医生的半定量估计的偏差程度。该分类方法的平均绝对误差也小于其表征之前的圆形结构分割阶段（2.08%）。以下部分进一步分析诊断结果，然后将其与来自其他分类算法的结果进行比较。4.1. 诊断结果根据图5，圆形对象分割阶段在某些情况下呈现无法定位相邻脂肪滴之间的边界。这是因为低放大20倍后，活检图像中的高压缩比，这导致相邻的环状脂肪结构重叠（红色轮廓线）。这种脂肪聚集模式产生的特征值与注释的脂肪样本的特征值不对应，从而影响GenClass方法的分类性能。因此，分类器无法识别所有脂肪结构，导致脂肪变性比率被低估。应该注意的是，研究人员认为增加的40倍放大率是理想的缩放因子，可以均衡活检图像质量与计算处理资源。基于此，据估计，密集出现的脂滴之间的外部边界可能变得更加明显，从而导致更少的重叠脂肪区域。在分类性能方面，基于表2b，液滴重叠效应导致GE方法产生更高的在8幅测试图像中，C错误脂肪量化误差大于相应的S错误图像分割输出：MS 14 -10783 （ 0.51%>0.30% ）， MS 14 -12212 （ 0.29%>0.06% ）， MS 14 -1559 （ 2.72%> 2.53% ）， MS 14-12212（0.29%>2382（2.62%> 2.48%）、MS 14 -2449（1.89%> 1.73%）、MS 14 -5898(1.00%> 0.75%）、MS 14 -786（3.46%> 3.23%）、MS 148355（2.31%> 0.75%）2.22%）。然而，经训练的系统在20个图像（总共28个）中产生较低的诊断错误值，以及降低的平均值。A. Arjmand等人阵列11（2021）1000788表2a脂肪定量结果。表2b脂肪定量错误。测试图像（×20）脂肪比率（%）w/o区域脂肪比率（%）与区域分类目视评估测试图像（× 20）图像分割误差（%）分类误差（%）分类Serr NBerrk-C4.5错误SVM错误GE错误805 805平均值：18.4818.2117.35平均值：2.082.012.182.011.991.93标准差：10.4410.5011.62标准差：1.181.311.761.341.361.13绝对误差高达0.15%，而图像分割阶段的绝对误差为2.08%。这些结果的图示见图1。 6使用网格线。平均而言，发现来自采用GE方法的分类阶段的绝对误差值（GEerr）（平均值=1.93，StD= 1.13）低于图像分割阶段（Serr）平均值=2.08，StD= 1.18）。该差异为0.15，95% CI [0.15，0.29]，统计学显著性（t（27）=2.272，p=0.032）。4.2. 与其他分类算法的性能比较在接下来的步骤中，GenClass方法在分类阶段的性能误差与四种广泛使用的监督算法进行了比较这些是指朴素贝叶斯、k-最近邻（k-NN）、C4.5决策树和支持向量机（SVM），其类似地旨在在图像分割阶段之后将脂肪结构与其他三个组织学类别分离。根据表2b，GenClass工具具有最小的平均脂肪量化FsegmFGEFDocNN错误1MS12-9.888.187.651MS12-2.231.691.441.761.650.5423945239452MS13-5.435.253.472MS13-1.961.541.541.671.541.7811663116633MS13-16.3416.0914.063MS13-2.281.320.031.581.252.0312414124144MS13-11.7611.6210.644MS13-1.120.630.380.800.650.9818536185365MS13-27.4227.2424.135MS13-3.291.631.531.551.823.11945394536MS13-25.8725.6023.996MS13-1.880.990.551.551.101.61992599257MS14-15.8315.6216.137MS14-0.301.371.491.001.190.5110783107838MS14-9.999.759.828MS14-0.180.820.480.100.780.0710801108019MS14-7.237.033.779MS14-3.472.962.993.132.913.26119331193310MS14-26.6426.4226.7110MS14-0.062.893.431.772.770.29122121221211MS14-12.8012.5212.6311MS14-0.160.370.490.230.320.11130401304012MS14-24.3224.1326.8512MS14-2.533.514.213.463.452.721559155913MS14-37.6037.4540.0813MS14-2.484.666.244.865.062.622382238214MS14-12.9712.8114.7014MS14-1.732.653.362.302.531.892449244915MS14-15.1714.9313.9815MS14-1.190.930.270.990.930.952451245116MS14-14.3214.1410.8416MS14-3.481.740.682.691.583.303215321517MS14-4.554.392.2717MS14-2.282.112.102.172.162.123686368618MS14-27.2326.8824.3218MS14-2.910.711.720.770.282.563854385419MS14-6.796.674.5219MS14-2.271.421.261.741.522.155561556120MS14-25.6625.4126.4120MS14-0.753.165.052.793.321.005898589821MS14-15.2414.8813.4221MS14-1.811.160.811.391.281.466402640222MS14-29.2829.0432.5022MS14-3.234.494.934.004.213.4678678623MS14-42.2742.1844.5023MS14-2.223.434.973.793.602.318355835524MS14-12.2311.687.0924MS14-5.144.694.664.894.744.599198919825MS14-32.2031.9929.7925MS14-2.410.711.530.290.432.209711971126MS15-5.144.902.7926MS15-2.352.011.632.091.962.112103210327MS15-30.9930.8329.6127MS15-1.380.140.910.110.001.212670267028MS15-12.3512.109.1228MS15-3.232.662.442.782.532.98A. Arjmand等人阵列11（2021）1000789=见图6。方法的脂肪定量误差的图形表示。所形成的网格线指示与图像分割阶段（Serr）相比来自采用GE方法的分类阶段（GEerr）的每个阶段的绝对误差表示其偏离医生定量解释。还观察到，由于放大倍数为20倍，脂肪聚集区导致Fsegm和FGE脂肪定量阶段产生的误差水平增加（>与朴素贝叶斯（NBerr=2.01%）、k-NN（k-NNerr=2.18%）、C4.5决策树（C4.5err=2.01%）和SVM相比，（SVM错误1.99%）算法。指出k-NN是唯一的与图像分割方法相比，该分类器产生更大的平均绝对误差（Serr=2.08%）。比较GEerr方法对上述四种分类算法（NBerr、k-NNerr、C4.5err和SVMerr）的分类误差进行配对双样本t检验。用这些统计检验得到的结果见图11。 7，没有统计学显著差异。4.3. 活检图像分析中的机器学习与深度学习近年来，随着深度神经网络的出现，医学领域正在经历智能诊断系统的革命。卷积神经网络（CNN）和自动编码器等深度学习架构已成功应用于医学图像分析任务，因为它们直接从图像数据中过滤出信息量最大的路径结构。因此，他们还在NAFLD和NASH病原体分析中提供了创新的解决方案，而无需手动注释。上述深度模型可能已经在肝活检样本中显示出高诊断性能，但是它们的训练过程是耗时的并且需要大量图像数据样本，使得它们可以推广到最关键的组织学特征。因此，在诊断问题清楚并且来自人类专家注释的组织学特征可用的情况下，应该采用传统的机器学习技术，使得在自动化分析系统的训练期间减少计算处理和存储器资源。5. 结论在这项研究中，提出了一种新的方法来检测和定量的脂肪含量的根据诊断结果，所提出的计算机视觉工具产生可靠的脂肪比率量化结果，因为所提出的基于语法进化（GE）的GenClass算法实现了1.93%的平均绝对误差，指的是与专科医生的视觉评估的偏差程度。与朴素贝叶斯、k-NN、C4.5决策树和SVM分类器相比，这是最小的脂肪量化误差（分别为2.01%、2.18%、2.01%和1.99%），见图7。四种分类算法（SVMerr、C4.5err、k-NNerr和NBerr）与GEerr方法比较的散点图表示和配对双样本t检验结果。星号表示显著差异值 *p 0.05，ns表示无显著差异值。<图像分割阶段（2.08%）是在对检测到的组织学对象进行分类之前。整体方法的主要优点在于，分类阶段模仿肝病学家基于这些结论，自动诊断工具可以识别HE染色活检标本中的多个肝脏解剖标志，并检测脂肪滴和其他组织改变之间的差异，这是可以解决临床试验中NAFLD患病率量化问题的一个步骤。竞合利益作者声明，他们没有已知的可能影响本文所报告工作确认我们感谢“伊庇鲁斯沉浸式虚拟、增强和混合现实中心”项目（MIS5047221）对这项工作的支持，该项目是在“加强研究”行动下实施的。A. Arjmand等人阵列11（2021）10007810该方案引用[1] Estes C，Razavi H，Loomba R，Younossi Z，Sanyal AJ.对非酒精性脂肪肝流行病的建模表明，疾病负担呈指数级增加。肝病学2018;67（1）：123-33。[2] Neuschwander Tetri BA.非酒精性脂肪肝BMC Med 2017;15（1）：45。[3] Zaitoun A，Al Mardini H，Awad S，Ukabam S，Makadisi S，Record C.慢性丙型肝炎患者肝活检中纤维化和脂肪变性的定量评估。临床病理学杂志2001;54（6）：461-5.[4] Marsman H，Matsushita T，Dierkhising R，Kremers W，Rosen C，Burgart L，Nyberg SL. 供体肝脏脂肪变性的评估：病理学家还是自动化软件？临床病理学2004;35（4）：430-5.[5] 杨伟杰，李晓斌.肝脏组织学彩色图像脂肪变性空泡的模糊提取算法。在：2007年第29届IEEE医学和生物学工程国际年会。IEEE; 2007年。p. 5575- 8[6] El-Badry AM，Breibourg S，Jochum W，Washington K，Paradis V，Rubbia-Brandt L，Puhan MA，Slankamenac K，Graf R，Clavien P-A.专家病理学家对肝脂肪变性的评估：金标准的终结。Ann Surg2009;250（5）：691-7。[7] Arjmand A，Giannakeas N.使用预训练的基于分类的系统在肝活检中进行脂肪定量。技术&应用科学研究2018;8（6）：3550-5。[8] [10]李国忠G，李国忠G，李国忠M，李国忠G.肝脏脂肪变性的自动形态学和定量评估的创新方法。HIV-HIV-HIV-OIL2009;24（1）：49-60.[9] 巴图尔湾使用稀疏线性模型在组织病理学图像中检测和空间分析肝脂肪变性。2016年第六届图像处理理论、工具与应用国际会议（IPTA）IEEE; 2016.p. 一比六[10] Giannakeas N，Tsipouras MG，Tzallas AT，Vavva MG，TsimplakidouM，Karvounis EC，Forlano R，Manousou P.使用机器学习和形态成像测量肝活检中的脂肪变性。2017年IEEE第30届计算机医疗系统国际研讨会（CBMS）。IEEE;

下载后可阅读完整内容，剩余1页未读，立即下载