没有合适的资源?快使用搜索试试~ 我知道了~
i本文的最新情况见最后医学信息学解锁19(2020)100341用于乳腺浸润性导管癌Hamidreza Bolhasania,Elham Amjadi b,Maryam Tabatabaeian c,Somayyeh Jafarali Jassbia,*a伊朗德黑兰伊斯兰阿扎德大学计算机工程系科学和研究处b伊朗伊斯法罕医科大学Poursina Hakim消化系统疾病研究中心c伊朗A R T I C L EI N FO保留字:乳腺癌浸润性导管癌数字病理学分级图像数据集A B S T R A C T乳腺癌是女性常见的癌症,也是世界各地女性死亡的主要原因之一。浸润性导管癌(IDC)是最常见的乳腺癌类型,约占所有诊断病例的80%。早期准确诊断对选择正确的治疗方案、提高患者生存率具有重要作用。近年来,人们一直在努力通过人工智能来预测和检测所有类型的癌症。一个合适的数据集是实现这一目标的第一个重要步骤。本文介绍了一个组织病理学显微镜图像数据集的922图像相关的124例IDC。数据集已经公布,可通过网址http://databio x.com查阅与类似数据集相比,该数据集的显著特点是,它包含来自IDC三个等级中的每一个的相等数量的标本,这导致每个等级约有50个标本1. 介绍癌症是全球范围内严重的公共卫生问题,也是美国的第二大死亡原因[1]。根据国际癌症研究机构(IARC)的数据,2018年报告了约1810万例癌症新发病例和960万例癌症死亡[2]。如图1所示,乳腺癌是一种常见的癌症,也是全世界死亡的主要原因之一,在2.12018年确诊病例100万例[2所有诊断的乳腺癌中约80%是浸润性导管癌(IDC),这使其成为所有乳腺癌中最广泛的表型亚型[7]。它生长在乳管中,并侵入导管外的乳房纤维病理学家通过目视检查苏木精和伊红(&HE)染色的组织来识别癌症类型和等级[17],如图所示。 二、IDC分级的准确识别对于选择适当的治疗方案和相应的患者结局至关重要组织学分级是一个预后因素和化疗反应的指标。它已被证明是密切相关的复发和死亡的频率,由于IDC,无病间隔和乳房切除术后的寿命更长。几项研究表明,高级别IDC患者,乳腺癌根治术后患者的副淋巴结(ALN)发生率和死亡率明显高于乳腺癌分级较低的患者组织学分级不仅与浸润性导管癌的复发和死亡显著相关,而且与乳腺切除术后的无病间期和总体生存时间显著相关,而与临床分期无关。高级别癌导致早期治疗失败,而在低级别肿瘤中更常观察到晚期复发[8,9]。近年来,人们一直在努力预测和检测所有类型的癌症,采用人工智能及其子类别像 机 学习 和 深 学习 [10 适当的数据集是实现这一目标的第一个重要步骤。有一些IDC的可用数据集[11因此,本研究旨在提供一个组织良好的组织病理学显微镜,用于分级IDC的内窥镜图像数据集图像取自用H E染色的乳腺组织,并根据其等级和放大水平进行标记本文的结构安排如下:第二部分是相关工作.第3节介绍了本研究的主要贡献,即准备好的图像数据集:databioX。本节介绍了图像采集和统计的方法。* 通讯作者。电子邮件地址:hamidreza. srbiau.ac.ir(H.Bolhasani),amjadi. yahoo.com(E.Amjadi),maryamtaba@yahoo.com(M.Tabatabaeian),s. jassbi@srbiau.ac.ir(S.J. Jassbi)。https://doi.org/10.1016/j.imu.2020.100341接收日期:2020年2月20日;接收日期:2020年4月27日;接受日期:2020年4月29日2020年5月16日网上发售2352-9148/©2020的 自行发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuH. Bolhasani等人医学信息学解锁19(2020)1003412����Fig. 1. 世界上癌症患者的比例[3]。从80%到85%。Guilherme等人[11]提供了一个乳腺癌的显微镜图像数据集,包括500张图像;其中400张用于训练pur。剩下的100个用于测试目的。图像是RGB与标签以CSV格式定义图像分为四类:正常、良性、原位和侵入性。没有提供与图像放大水平有关的信息,这是这项工作的一个弱点琼安湾Elmore等人[12]研究了解释乳腺活检标本的病理学家之间的诊断一致性。研究的数据集包含2011年至2014年期间收集的60个乳腺活检切片,包括浸润性乳腺癌、导管原位癌、atyp-cancer、图二、 乳腺组织HE 染色&。此后,第4节和第5节概述了论文和数据的价值。2. 相关作品法比奥Spanhol等人[10]提出了一个名为BreakHis的数据集,用于乳腺癌组织病理学图像分类。作者介绍了从82名患者中采集的7,909张乳腺癌组织病理学图像的数据集图像以各种放大倍数提供:40X、100X、200X和400X,并分为两类:恶性和良性。利用四种机器学习模型的基线模式识别系统用于分类,并且准确率范围表1数据集中文件的结构数据集规格值1图片数量2图像格式RGB3文件类型JPEG4分辨率2100 �1574病理性增生及无增生的良性病变。作者指出,他们发现75.3%的一致性,病理学家之间的一致性较高。本研究对调查数据进行了详细的元凯湾Tao等人[13]提出了利用非线性显微镜(NLM)评估乳腺病理学。共采集50例患者的179例标本。研究的图像数据集包括正常乳腺组织、纤维腺瘤、常见导管增生、纤维囊性变化、小叶原位癌(LCIS)、浸润性小叶癌(ILC)和IDC。结果证实,基于NLM图像的诊断具有很高的准确性Yasmeen Mr.George等人[14]描述了一种基于细胞学图像的远程计算机辅助乳腺癌检测和诊断系统。作者使用了92个乳腺细胞学图像,包含11502个细胞核。图像的分辨率从640 - 480到2560 - 1920像素不等。本研究中使用了四种机器学习监督分类算法来区分恶性和良性乳腺组织。未提供研究数据集中有关乳腺癌类型及其分级的Marek Kowal等人。[15]基于细针活检显微镜图像进行了乳腺癌的计算机辅助诊断。在这篇文章中,500个细胞学图像从50个病人(10图像每个患者)被认为并分为两类恶性5每英寸点数6位深度1276� 9567224良性的图像为BMP格式的RGB,具有704 578像素分辨率。K-means(KM),fuzzy c-means(FCM),Gaussian mix7焦距4 mm8ISO感光度ISO-209Apple/苹果iPhone 7 Plus10大小119 KB模型(GMM)和竞争神经网络(CNN)是本研究中使用的监督机器学习算法。获得的准确度从96%到100%不等H. Bolhasani等人医学信息学解锁19(2020)1003413��表2数据集中文件的结构部分文件名样品1样品编号012癌症类型BC-IDC3病理档案编号90574放大倍率4X5指定放大倍数13. databiox数据集DataBioX是本研究准备的图像数据集的名称这是一个IDC诊断患者的组织病理学显微镜图像数据集,用于分级分类,共包括922张图像。图像为RGB格式,JPEG类型,分辨率为2100 1574和1276 956像素。表1显示了数据集的技术信息。数据集中文件的名称基于表2中提供的格式。它还显示了数据集中图像的命名结构,例如:01_BC_IDC_9057_4X_1。这些标本是用H E染色的乳腺组织,取自2014年至2019年在伊朗伊斯法罕医科大学Poursina Hakim研究中心诊断的124名该数据集已发布,现在可以在http://databiox.com上访问。对于每个标本,提供四个放大倍数:4 X,10 X,20 X和40 X,如图所示。 四、根据病理学家的意见,在某些情况下,会显示一个例如,几乎所有的图像都有四个40X图像,标本该数据集中的样本标记是基于改良的Bloom Richardson组织学分级完成的。该分级方法评价小管形成的量、核多形性的程度和有丝分裂计数(或有丝分裂率)。每个变量的得分为1、2或3,这些得分相加产生一个等级。有丝分裂评分由在肿瘤的最有丝分裂活性部分中的10个连续高倍视野(HPF)中发现的有丝分裂像的数量确定。评分3 - 5,分化良好(I级);评分6 - 7,中度分化(II级);评分8 - 9,分化不良(III级)[18]。该数据集与类似数据集的区别在于,它包含来自IDC三个等级中每个等级的相同数量的标本,每个等级约有50个标本。总体而言,采取了五个基本步骤来准备这个数据集,如下所列,如图所示。3.第三章。1. 选择IDC2. 收集HE染色的载玻片3. 使用改良Bloom Richardson组织学分级4. 四个放大级别5. 组织数据集正如第2节所讨论的,相关作品都没有提供基于等级的分类。这种分类是本工作的贡献。表3基于每个等级和显微镜放大水平的样本的详细数据集信息。数字4X10X20X40XI级37454043131二级43596463180III级44564949143总124160153155454图五、数据集 中 的患者和图像数 量 。图三. 准备databioX数据集的五个步骤图四、 databio X数据集的 所 有 样 本 均以四种 放大倍数提 供 (a)4 X、(b)10 X、(c)20 X和(d)40 X。H. Bolhasani等人医学信息学解锁19(2020)1003414见图6。基于databioX数据集中提供的放大水平的IDC(I级)标本总和。见图7。基于databioX数据集中提供的放大水平的IDC(II级)标本总和。关于基于其等级和放大水平的标本数量的详细信息见表3和图3。五比八4. 数据价值当前数据集是用于乳腺癌IDC组织学分级的综合图像数据集。数据集中的图像根据等级和放大水平进行标记。该数据集将用作机器学习分类算法的训练数据集。图像数据集将是有用的病理学家和医学生的学习和调查的目的。见图8。基于databio x数据集中提供的放大水平的IDC(III级)标本总和。5. 讨论最近,已经做出了一些了不起的努力来预测和检测所有类型的癌症,特别是乳腺癌,采用人工智能及其子类别,包括机器学习和深度学习。组织良好的数据集是训练机器学习算法的基本要求。组织学分级是预后的一个非常重要的因素,化疗反应。回顾最近十年(2010-2020)[ 10-15 ]进行的几项主要相关工作,发现没有用于IDC分级的组织病理该数据集可在http://databiox.com和ElsevierMen上访问-deley数据集门户网站:https://data.mendeley.com/datasets/w7jjc X 7 gj6/1 [16]。DatabioX包括922张RGB格式的JPEG格式的组织病理学图像,这些图像来自伊朗伊斯法罕医科大学Poursina Hakim研究中心2014年至2019年期间诊断为IDC的124名患者对于每个标本,提供四个放大倍数(4X、10X、20X和40X数据集中的所有图像都根据其诊断等级进行标记,可用于训练机器学习算法进行IDC等级检测。附录A. 补充数据本 文 的 补 充 数 据 可 在 https : //doi 网 站 上 找 到 。org/10.1016/j.imu.2020.100341。引用[1] 丽贝卡L,西格尔MPH,金伯利D,米勒MPH,艾哈迈丁杰马勒DVM。癌症统计。 CA A Cancer J Clin 2019;69(1):7-34. 2019年1月/2月。[2] Wild CP,Weiderpass E,and Stewart BW,ISBN:978-92-932-0448-0。[3] 健康评估与评价研究所(IHME)。2017年全球疾病负担研究。GBD 2017;2018.[4] Fitzmaurice C,Allen C,Barber RM,Barregard L,Bhutta ZA,Brenner H,Dicker DJ,Chimed-Orchir O,Dandona R,Dandona L,et al. Global,regional,and nationalcancer incidence,mortality,years of life lost,years lived withdisability,anddisability-adjusted life-years for 32 cancer groups,1990 to2015:a systematicanalysis for the global burden of disease study. JAMAoncol2017;3(4):524-48。����H. Bolhasani等人医学信息学解锁19(2020)1003415[5] 世界癌症研究基金会。乳腺癌统计数据。 2018年[6] 张文辉,李文辉,张文辉. 乳腺癌统计数据。 CA癌症临床杂志2011;61(6):408-18. 2011年。[7] Cruz- Roa Angel等人,使用卷积神经网络自动检测全切片图像中的浸润性导管癌。收录于:Proceedings vol 9041,Medical Imaging 2014:Digital Pathology;2014。p. 904103。[8] 赛义德放大图片作者:Edi Brogi,Fredrick C.Koerner和Paul Peter Rosen,第430-431页。[9] 杨伟,陈伟.乳腺癌的预后因素与阳性淋巴结数量和肿瘤大小无关:SEER中161708例乳腺癌的研究程序. 病理学实验室医学文献2014年8月;138(8):1048-52。https://doi.org/10.5858/arpa.2013-0435-OA。[10] Spanhol Fabio A,Oliveira Luiz S. Caroline Petitjean和Laurent Heutte,“乳腺癌组织病理学图像分类数据集。在:IEEE生物医学工程交易; 2015年。第00卷,第00号。[11] Aresta Guilherme等,BACH:乳腺癌组织学图像的巨大挑战。医学影像分析,第56卷; 2019年8月。p. 122比39[12] ElmoreJoann G,et al.病理学家之间的诊断一致性解释乳腺活检标本。美国医学会杂志2015;313(11):1122-32。2015年3月17日。[13] Tao Yuankai K,et al. Assessment of breast pathologies using nonlinearmicroscopy.Proc Natl Acad Sci Unit States Am 2014;111(43):15304-9.十月 二十八日。[14] AubriceGeorge Yasmeen,et al. 基于细胞学图像的远程计算机辅助乳腺癌检测与诊断系统。 IEEE Syst J Sep 2014;8(3).[15] KowalMarek,et al. 基于细针活检显微图像的乳腺癌计算机辅助诊断。 计算机生物医学2013年10月;43(10):1563-72。[16] Bolhasani Hamidreza,Amjadi Elham,Tabatabaeian Maryam,Jassbi Jafarali,Somayyeh.用于乳腺浸润性导管癌分级的组织病理学图像数据集。2020年。Mendeley Data,v1,https://doi.org/10.17632/w7jjcX 7gj6.1.[17] Veta Mitko等人,&HE染色乳腺癌组织病理学图像中的自动核分割。PloSOne2013;8(7):e70221.[18] Ellis IO,Elston CW.组织学分级。In:O'Malley FP,Pinder SE,editors.乳房病理学Philadelphia,PA:Elsevier; 2006.p. 225比33更新医学信息学2020年第21期第页DOI:https://doi.org/10.1016/j.imu.2020.100474医学信息学解锁21(2020)100474关于以前发表的文章中缺少竞争利益声明的勘误表竞争利益声明不包括在出版版本的文章,出现在以前的卷信息学医学解锁。因此,在发表后联系了以下文献的作者,要求发表利益声明:1. https://doi.org/10.101“Automated scraping of structured datarecords from health dis- cussion2. https://doi.org/10.1016/j.imu.2018.04.003“Moleculardynamics simulation approach to explore atomistic molecularmechanism of pero3. “An计划使用智能卡的电子医疗信息系统https://doi.org/10.1016/j.imu.2018.02.0034. “A numerical modeling of an amperometric-enzymatic basedurine acid biosensor for GOUT arthritis diseases“[Informatics inMedicine Unlocked,2019; 12C:Pages:143-147] https://doi.2018.03.001/10.1016/j.imu.20185. “使用最佳正交小波滤波器进行自动心跳分类和心律失常检测“[Informatics in Medicine Unlocked,2019,16 C;文章编号:100221] https://doi。org/10.1016/j.imu.2019.1002216. https://doi.org/10.1016/j.imu.2018.10.004“CHROMATOGRAPHIC ANALYSIS OF PHYTOCHEMICALS IN7. “Sperm motility analysis system implemented on a hybrid ar-chitecture to produce an intelligent analyzer医 学 解 锁 , 2020; 19 C; 文 章 编 号 : 100324]https :doi.org/10.1016/j.imu.2020.1003248. “Medical video compression using bandelet based on liftingscheme and SPIHT coding: in search of high visual[Informatics in Medicine Unlocked , 2019; 17C : Articlenumber 100244]https://doi.org/10.1016/j.imu.2019.1002449. https://doi.org/10.1016/j.imu.20“Ahistopathologicalimagedataset for grading breast invasive ductal carcinomas20.10034110. https://doi.org/10.1016/j.imu.2019.100231“Cancer diagnosis inhistopathological image: CNN based approach”11. “开放的D1 NAMO数据集:用于非侵入性1型糖尿病管理研究的多模态数据集“[Informatics in Medicine Unlocked,2018; 13 C:Pages:92-100] https://doi. 2018.09.00312. https://doi.org/10.1016/j.imu.2018.07.00“Thepredictionofgood physicians for prospJective diagnosis using data mining13. “Prediction of Pathological Complete Response after Neo-adjuvant Chemotherapy for Breast Cancer using Ensemble Ma-chine Learning”货号:100219]https://doi.org/10.1016/j.imu.2019.10021914. “Classification of intra-genomic helitrons based on featuresextractedUnlocked , 2019; 18C : Article number : 100271] https ://doi. org/10.1016/j.imu.2019.10027115. “Visual feedback framework for rehabilitation of stroke patients网址:doi.org/10.1016/j.imu.2018.10.00216. “ 空 间 扩 展 子 宫 活 动 发 生 器 的 源 成 像 技 术 的 性 能“[Informatics in Medicine Unlocked ,2019; 16 C文章编号:100167] https://doi.org/10.1016/j.imu.2019.10016717. https://doi.org/10.1016/j.imu.201“Automated classification ofbenign and malignant cells from lung cytological images usingdeep convolutional neural network”9.100205原 文 DOI : https://doi.org/10.1016/j.imu.2019.100205https://doi.org/10.1016/j.imu.2019.100221 , https : //doi.org/10.1016/j.imu.2019. 100167 ,https://doi.org/10.1016/j.imu.2018.04.003,https://doi.org/10.1016/j.imu.2020.100341https://doi.org/10.1016/j.imu.2018.01.003,https://doi.org/10.1016/j.imu.2018.03.001,https://doi.org/10.1016/j.imu.2018.10.002,https://doi.org/10.1016/j.imu.2020.100324,https://doi.org/10.1016/j.imu.2018.09.003,https://doi.org/10.1016/j.imu.2019.100219https://doi.org/10.1016/j.imu.2018.02.003https://doi.org/10.1016/j.imu.2019.100244 ,https ://doi.org/10.1016/j.imu.2018.07.005,https://doi.org/10.1016/j.imu.2019.100271,https://doi.org/10.1016/j.imu.2018.10.004,https://doi.org/10.1016/j.imu.2019.100231。https://doi.org/10.1016/j.imu.2020.1004742020年11月4日网上发售2352-9148/© 2020由Elsevier Ltd.发布可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imu
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功