没有合适的资源?快使用搜索试试~ 我知道了~
SoftwareX 9(2019)223原始软件出版物IdentiCyte:简单的红细胞识别软件纪尧姆Garnier,Clare A. Manderson,Saveen Giri,GilGarnier澳大利亚生物资源加工研究所(BioPRIA),莫纳什大学化学工程系,Clayton VIC 3800,澳大利亚ar t i cl e i nf o文章历史记录:2018年7月23日收到收到修订版,2018年12月7日接受,2019年保留字:图像识别细胞形状红细胞a b st ra ct通过形状计数和识别红细胞(RBC)是诊断多种疾病和病症的重要步骤。这是传统的手工完成(一个繁琐和耗时的过程)或者使用专门的设备。有几种工具可以自动对图像中的细胞进行计数和分类;然而,它们往往为了具有广泛的应用而牺牲简单性在本文中,我们提出了IdentiCyte,一个专门设计的程序,可以尽可能简单地从一系列显微镜图像©2019作者由爱思唯尔公司出版这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)中找到。代码元数据当前代码版本1.0用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX_2018_111法律代码许可证GNU-GPL 3或更高版本使用git的代码版本控制系统使用Python的软件代码语言、工具和服务编译要求,操作环境依赖性64位Python 3.5及以上,Python包:tkinter,Pillow,XlsxWriter,numpy [1],scipy [2],opencv-python [3],matplotlib [4],scikit-learn [5],pyinstaller,mttkinter如果可用,链接到开发人员文档/手册问题支持电子邮件gil. monash.edu软件元数据当前软件版本1.0此版本可执行文件的永久链接https://github.com/IdentiCyte/IdentiCyte/tree/master/dist合法软件许可证GNU-GPL 3或更高版本计算平台/操作系统Windows安装要求依赖关系如果可用,请链接到用户手册- 如果正式出版,在参考文献列表中包括对该出版物https://github.com/IdentiCyte/IdentiCyte/tree/master/Manual问题支持电子邮件gil. monash.edu∗通讯作者。电子邮件地址:gil. monash.edu(G. Garnier)。https://doi.org/10.1016/j.softx.2019.02.0061. 动机和意义红细胞(RBC)形状的识别和分类是诊断、输血和免疫治疗的重要问题2352-7110/©2019作者。 由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softx224GFG Garnier,CAManderson,S.Giri等人/SoftwareX 9(2019)223生物医学应用。红细胞形状有助于诊断疾病和紊乱,如白血病、镰状细胞性贫血和疟疾[6]。细胞传统上是手动计数的,这是繁琐、耗时的,并且增加了人为不一致性的因素因此,已经开发了许多使该过程自动化的方法。其中一些依赖于昂贵的专业设备[7,8],这在许多情况下可能是不切实际的。一种更实惠的方法是使用软件来分析由简单的光学显微镜拍摄的图像。在这里,我们将IdentiCyte作为一个简单的软件,用于基于形状自动计数和识别细胞。IdentiCyte是作为一个项目的一部分开发的,该项目旨在量化RBC(红细胞)在各种溶液中悬浮引起的形状变化。悬浮在其溶液中的未染色细胞直接通过光学显微镜成像用于检查。通过最初将一些示例细胞形状分类为六个不同的类别(图1B), 1)对于文库,IdentiCyte能够从数百个光学显微镜图像中有效且可靠地提供一万个细胞的细胞群体统计。当手动识别时,不同的人可能会对相同的细胞进行不同的分类。此外,不能将对比度增强染料添加到细胞中以便于可视化,因为这样做可能会改变它们的天然形状。这导致细胞在显微镜图像中往往非常模糊,使得不同的形状难以区分。我们创建了IdentiCyte,因为我们很难找到用户友好的软件来识别和计数显微镜图像中的细胞类型。一些以前的出版物[6,9-已经开发并出版了若干软件供公众使用。其中第一个是Blobbastion[12],它也是作为一种简单的方法开发的。来计数细胞。然而,Blobbastion仅计数细胞而不识别它们此外,Blobfinder是专门为荧光图像显微镜开发的目前,有一个测试版的Blobfinder,是建立工作与明场图像。用于分析细胞的另一个感兴趣的软件是CellPro-filer [13]。它是一个非常强大的工具,可以将图像处理步骤应用于管道中的图像虽然CellProfiler本身只应用图像处理,但有一个配套软件CellProfiler Analyst [14],它可以使用机器学习技术来计数和识别细胞。CellProfiler非常强大,特别是与CellProfiler Analyst搭配使用时,但它的强大是以简单性为代价的。有许多模块,每个模块都有几个要解析的选项。复杂性只会因为需要运行两个独立的软件才能获得完整的结果而增加Cytomine [15]看起来相当强大,但到目前为止,只有在基于Linux的操作系统上使用它的指令目前,微软Windows在台式机上的市场份额为82.45%[16]。虽然可以在Windows操作系统上安装和运行该软件,但对于普通研究人员来说,使其在计算机上工作所花费的时间可能与使用Cytomine节省的时间相媲美。因此,我们需要制作自己的软件。我们探索了几种技术来识别图像中的细胞。[6]中提出的方法这给出了细胞总数的良好结果,但是我们希望通过形状区分细胞以及计数它们,因此这种方法不适合我们的目的。[9]中提出的方法使用图像处理技术和人工神经网络(ANN)。它们通过仅使用填充了所有孔的单元的二进制轮廓来确定单元形状。这将使在我们的项目中不可能检测到双凹和球形红细胞之间的差异。相反,我们选择使用特征脸来识别RBC,这是 Turk等人提出的一种方法。[17]最初设计用于面部识别,该方法已被一种新的置信度度量增强。该方法使用主成分分析从预先识别的细胞库中提取特征。这些特征可以用于将新图像与库中的图像进行比较,并确定哪一个最相似。这种方法的一个关键限制是,使用空格意味着库中的图像必须具有相同的像素数(为了简单起见,也必须具有相同的尺寸)。这意味着要分析的细胞应该都是大致相同的大小。该方法的优点在于,图像可以与很少的关键特征(或主成分)进行比较。这不仅增加了计算复杂性,还可以提高准确性。此外,当与可以自动识别的细胞的数量相比时,在文库中手动识别和使用的细胞的例如,在我们的IdentiCyte不限于单一操作系统,但它可以从Windows可执行文件运行,并且可以通过单击单个按钮进行分析。IdenticCyte允许用户定义RBC或其他细胞2. 软件描述2.1. 软件构架IdentiCyte的设计旨在自动识别一批图像中的RBC分析过程可以大致分为两个主要阶段:第一,建立细胞识别示例库;第二,在待识别图像上运行程序。通过将每个类别中的单元格示例放置在与该类别对应的文件夹中来创建库。我们建议使用IdentiCyte中提供的提取细胞功能来获得这些细胞,因为它符合程序的识别要求。一旦细胞图像数据库被放置在库的正确文件夹中,就可以使用库选项卡中的编译库按钮来编译库。在编译过程中,读取和转换库文件夹中的所有图像该文件包含一个正交向量矩阵,表示库中的所有单元格,以及每个单元格所属类别的列表。默认情况下,提取的单元格为3位灰度格式,但用户可以更改位深度识别过程也分为两个不同的部分:检测和识别。检测阶段使用图像处理技术来确定每个图像中细胞的位置。如图2所示,检测开始于拍摄细胞图像(2.a)并提取图像的单个颜色通道(2.b)。为此,应用自动二进制阈值(使用Otsu然后,所得到的二进制图像具有填充的孔(2.d),这有助于计算面积,并确保单个细胞在下一步中不会被错误地分割。然后使用分水岭方法[20]对该图像进行分割,以分离被视为一个暗斑点(2.e)的多个细胞,以便可以单独识别它们。这个过程呈现了一个带有黑点的白色图像,每个黑点的面积和中心都可以计算出来(2.f)。测量区域用于丢弃太小的斑点,这对于从图像中去除碎片很有用。识别阶段,描绘在图。3、将检测到的单元格转换为3位灰度,GFG Garnier,CAManderson,S.Giri等人/SoftwareX 9(2019)223225∑√()×Fig. 1. 由于不同条件而改变形状的红细胞的示例图像 使用Nikon Eclipse光学明场显微镜拍摄的图像,100倍物镜。图二. 检测细胞所采取的图像处理步骤。(a)红细胞图像,(b)绿色通道,(c)阈值,(d)填充孔,(e)分段,(f)中心Found.缩放并将它们与编译库文件中的单元格进行比较。这是通过将未识别细胞的像素强度排列成向量来完成的, . . ,xn),并将其投影到由库矩阵定义的空间上,所述库矩阵由表示库中的每个单元i的向量组成yi=(yi1,yi2,. . . ,yi n)。定义相似性的一种方法是使用这两个向量之间的欧几里得距离。可以通过下式来求出Rxx和每个yRsi之间的欧几里得距离di:表1比较四个最接近的库单元与正在分析的单元的距离的示例。 单纯从距离上判断,该细胞将被归类为1 类。等级距离类别120个类别1221第2322第2459第3ndi=j=1(xj−yij)2(一)置信度(形状)=101i=1秩i1距离i如果单元i被成形然后将这些距离从最近到最远进行排序。很容易将被分析的细胞与库中最接近的细胞进行相同的分类。不幸的是,最近的单元格不一定代表最好的类别。考虑表1中的简化示例,该示例显示了从分析细胞到样品的距离。这里,类别1、2和3是不同的细胞形状。通过简单地选择最近的类别,目标单元格将被认为是类别1。但是库中的两个第2类细胞,它们与未知细胞的距离相似。因此,可能还不清楚是否它实际上是第二类或第一类。我们提出了一个新的度量,信心(方程。(2)),其考虑秩和距离以更准确地识别小区。(二)对于少量最近邻中的每一个,计算置信度。然后,我们通过计算百分比来计算哪些类别具有更大的代表性。具有高于用户定义的阈值的最大百分比的那些被自动分类。这是必要的,因为单元形状的某些方面在同一类别中可能会有很大差异,并且单元与库中最接近的匹配之间的距离可能会有很大差异。对于上面的示例,置信度百分比(如表2所示)表明该单元格属于第2类。所提出的置信度量对所选择的最近邻的数量是适度敏感的这样做的目的是使用细胞的等级来降低那些不像其他细胞那样接近的细胞的贡献这样做是为了进一步区分代表226GFG Garnier,CAManderson,S.Giri等人/SoftwareX 9(2019)223表2图3.第三章。 显示所有选项供用户验证的识别过程。机密文件就会被销毁 这是因为许多遥远的细胞减少了上表中每种细胞类型的置信度使用等式(1)计算。(二)、使用这种方法,细胞被更准确地识别为类别2。置信分数置信百分比0.0500 42.7%类别10.0628 53.7%类别20.0042 3.6%第3类似的连续状态,但该选项并不像预期的那样一般来说,随着所考虑的相邻小区的数量增加,确定性地置信度,并且单个细胞类型更难以满足自动分类细胞所需的阈值此外,太少会导致细胞被错误分类,特别是对于在外观上有很多变化的细胞类型,如棘细胞。在我们的实验中,我们发现选择最近的10个单元为平衡这两个属性提供了一个很好的中间点细胞的分类、置信度和位置被保存到一个文件中,该文件当一组内每个图像中的所有细胞都被识别后,分析的统计数据将保存到Excel文档中。GFG Garnier,CAManderson,S.Giri等人/SoftwareX 9(2019)223227图四、 IdenticCyte用户界面。显示窗口显示分析的当前状态2.2. 软件功能IdenticCyte用户界面(如图所示) 4)由四个选项卡组成:分析选项卡、查看选项卡、库选项卡和选项选项卡;显示窗口和取消按钮。显示窗口将显示来自软件的与其分析阶段相关的消息。分析选项卡通过查找图像中的单元格并将其标识为用户定义的类别来分析图像如图3所示,用户还可以选择手动识别具有低置信度的细胞。以这种方式识别的细胞将被添加到库中,以一种IdenticCyte还具有提取细胞用于锂离子电池的能力。一旦这些细胞被手动分类到它们的分类文件夹中,它们就可以被编译了。与库相关的所有功能都可以在库选项卡中找到在查看选项卡中,可以查看已识别的图像这将读取细胞的位置和分析结果,并显示带有彩色编码标签的图像(图1)。5)说明细胞的识别和识别的置信度当这些标记的图像被显示用于演示或在软件外部显示时,可以通过按“s”键来保存它们。最后,用户还可以在IdenticCyte操作中更改几个关键变量。其中包括在图像中选择的颜色通道、阈值方法、照明、库中细胞表示的位深度、提取细胞的窗口的宽度、被视为细胞的对象的最小像素区域以及细胞必须明确放入细胞中的置信百分比输出的Excel文件包括两个工作表:一个摘要选项卡,概述了整个批次的图像分析,和每个图像的细分,其中显示了有多少细胞在每个图像,和统计类别的变化。汇总表显示分析的细胞总数、批次中每种类型的细胞数以及所有图像。还包括用于示例的所有设置的摘要第二张表包含图像中以及整个批次中每种类型的单元格的数量,以该图像中单元格总数的还显示了每个图像中所有细胞的平均置信度得分3. 说明性实例在Iden-tiCyte的开发中,已经花费了大量的努力,以确保分析细胞和审查结果尽可能简单。在这里,我们将给出一个例子,说明如何使用包含的库分析一批图像并查看分析结果默认情况下,IdentiCyte会打开这可以通过按“输入文件夹”文本框旁边的按钮这将打开一个文件夹选择窗口。选择此选项后,下一步是单击 这将开始分析,如图所示。 四、输出框将显示程序当前正在执行的操作首先,它将显示包含要分析的图像的文件夹的路径,并指示识别开始。当IdentiCyte分析图像时,它将显示当前正在分析的图像的名称。分析完所有图像后,将完成包含结果的文件,在此期间输出完成后,程序将显示分析完成后这将打开一个窗口(图5),显示图像中每个细胞的识别。分析的总体统计数据也在包含分析图像的文件夹中的Excel文档中提供4. 影响IdenticCyte是一个简单而强大的程序,便于细胞计数和基于图像228GFG Garnier,CAManderson,S.Giri等人/SoftwareX 9(2019)223图五、 查看选项将细胞识别与相应的 置信度显 示 为用户原始图像数据上的彩色编码标签。显微镜IdentiCyte被设计用于简化分析细胞的过程。作为一个自动细胞计数器的直接结果与此相关的是IdenticCyte的另一个优势:它可以快速计数细胞,在具有16 GB RAM的Intel Core i7-7700 HQ上计算超过1700个细胞只需不到五分半钟。这意味着样品的结果比手工计数更快当人类对细胞进行分类时,他们必须为每个细胞确定它是哪种类型。随着细胞数量的增加,对细胞进行计数所花费的时间量也增加,在足够的时间之后,计数器可能变得疲劳,这导致人类计数的准确性不一致。此外,当细胞的类别相似时,不同的人可能不同意细胞应该属于哪一类。这说明了IdenticCyte的主要优势,它的一致性,客观性和速度。由于IdenticCyte是一个程序,当它被给予相同的输入数据时,它将产生相同的输出,虽然总是会有细胞分类不正确,但这种不准确性将是一个恒定的因素,在分析结果时可以很容易地考虑到。当构建文库时,相对于总量需要鉴定很少的细胞,这也允许协同进行文库构建。这有助于减少分类的主观性因为多个人可以验证相对少量的细胞分类而不会屈服于疲劳的影响IdentiCyte已被用于确定与溶液性质相关的细胞形状的研究中,其中它被用于代替流式细胞仪,具有优势;第一个是不必操作设备节省了大量时间,第二个是流式细胞仪以光散射的形式提供了关于细胞形状的有限信息。最后,流式细胞仪需要对细胞进行染色,这可以使细胞脱离其天然形状。由于IdentiCyte是免费的,它也可以用于购买流式细胞仪或其他设备是不可行的选择的情况我们对简单性的强调也允许IdentiCyte在没有正式培训或编码知识的情况下使用。虽然IdentiCyte是专门设计用于识别和计数红细胞的,但它可以通过创建新的库来扩展以识别其他类型的细胞。5. 结论通过IdentiCyte,我们提供了一个简单的界面来识别形状并对显微镜捕获的大量细胞进行计数。这种对可用性的强调允许自动化细胞识别的好处,而不需要花费大量时间学习专业软件的复杂性和功能,或者操作专用机器所需的费用和时间确认这 项 工 作 得 到 了 澳 大 利 亚 研 究 委 员 会 ( LP 110200973 ) 和Haemokinesis的支持。我们要感谢澳大利亚红十字会血库提供血液样本,Samuel Li和Daniel Ly提供测试图像。利益冲突作者声明不存在利益冲突引用[1]奥列芬特一个指南NumPy,卷。1.一、Trelgol Publishing USA; 2006.[2]Jones E,Oliphant T,Peterson P,et al. SciPy:Open Source scientific tools对于Python。2001,http://www.scipy.org/,[在线;今天访问[3]布拉德斯基湾OpenCV图书馆Dr. Dobb's Journal of Software Tools. 两千[4]亨特JD。Matplotlib:2D图形环境。计算机科学与工程2007;9(3):90-5.[5]Pedregosa F , Varoquaux G, Gramfort A, Michel V, Thirion B , GriselO,Blondel M,Prettenhofer P,Weiss R,Dubsovic V,et al. Scikit-learn:Machinelearningin Python. J Mach Learn Res 2011;12(Oct):2825[6]Agrawal P,Verma P.使用图像处理技术的红细胞自动检测和计数。Int J SciRes Manag2015;3:2692-5.[7]穆恩岛贾费尔扎德数字全息成像三维形态特征增强人红细胞识别。J BiomedOpt2016;21(12):126015。GFG Garnier,CAManderson,S.Giri等人/SoftwareX 9(2019)223229[8]Pinto RN,Sebastian JA,Parsons M,Chang TC,Acker JP,Kolios MC.图像流式细胞术在红细胞形态学表征中的应用。在:高速生物医学成像和光谱学:走向大数据仪器和管理II,第10076卷。国际光学与光子学学会; 2017年,p. 100761 F.[9]Tomari R,Zakaria WNW,Jamil MMA,Nor FM,Fuad NFN.血涂片图像中红细胞分类的计算机辅助系统。ProcediaComput Sci2014;42:206-13.[10]Ali J,Ahmad AR,George LE,Der CS,Aziz S. 基于几何特征的红细胞识别。Int J Comput Sci Issues 2013;10(1):90.[11]Zheng Q,Milthorpe BK,Jones AS.直接神经网络在细胞自动识别中的应用。细胞计数A部分2004;57(1):1-9。[12]Allalou A,Wählby C. Blobfinder,一种用于荧光显微镜图像细胞术的工具。计算方法程序生物医学2009;94(1):58-65。[13]Carpenter AE,Jones TR,Lamprecht MR,Clarke C,Kang IH,FrimanO,Guertin DA,Chang JH,Lindquist RA,Moffat J,et al. CellProfiler:imageanalysis software for identifying and quantifying cell phenotypes.GenomeBiol2006;7(10):R100.[14]Jones TR , Kang IH , Wheeler DB , Lindquist RA , Papallo A , SabatiniDM,Golland P,Carpenter AE. CellProfiler Analyst:用于复杂图像屏幕的数据探索和分析软件。BMC Bioinform2008;9(1):482.[15]Marée R , Rollus L , Stévens B , Hoyoux R , Louppe G , Vandaele R ,Begon J-M,Kainz P,Geurts P,Wehenkel L.使用细胞分裂素的多千兆像素成像数据的协作分析。Bioinformatics 2016;32(9):1395-401.[16]全 球 桌 面 操 作 系 统 市 场 占 有 率 . http://gs.statcounter.com/os-market-share/desktop/worldwide网站。[Ac-2018年7月11日[17]Turk MA,Pentland AP.使用特征脸进行人脸识别。计算机视觉与模式识别,1991年。会议记录CVPR'91.,IEEE计算机协会会议。IEEE; 1991,p.586-91[18]大 津 湾 一 种 从 灰 度 直 方 图 中 选 取 阈 值 的 方 法 。 IEEETransSyst ManCybern1979;9(1):62-6.[19]Zack G,Rogers W,Latt S.姐妹染色单体交换频率的自动测量。组织化学和细胞化学杂志1977;25(7):741-53。[20]李宁,刘明,李勇.结合分水岭变换和水平集方法的图像分割算法。在:声学,语音和信号处理,2007年。ICASSP 2007年。IEEE国际会议,卷。1,IEEE; 2007.p. I-613.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功