第 37 卷第 4 期
2008 年 8 月
信 息 与 控 制
Information and Control
Vol.37, No.4
Aug., 2008
文章编号: 1002-0411(2008)04-0445-08
面向肺癌 CAD 系统的感兴趣区域特征选择与分类算法
魏 颖,郭 薇,孙月芳,赵大哲,季 策
(东北大学信息科学与工程学院,辽宁 沈阳 110004)
摘 要:本文重点研究 ROI 的特征提取与分类方法.首先,根据医学征象对 ROI 进行特征提取;为了提高
分类的准确性,采用概率分布可分性对原始提取的特征进行特征选择.然后,利用 SVM 对选择的特征进行定
量描述;采用特征量化参数对 Mahalanobis 距离进行加权改进,加权的 Mahalanobis 距离使类间差别明显增大.
最后采用加权改进后的 Mahalanobis 距离将 ROI 分类为结节或非结节.利用所提 ROI 特征选择和分类算法进
行肺结节检测实验;肺结节检测灵敏度为 94.6%,漏诊率为 5.4%,可以为医生进行肺癌早期诊断提供帮助信
息.
关键词:肺癌计算机辅助诊断(CAD);感兴趣区域(ROI);特征提取;概率可分性;特征选择;加权
的 Mahalanobis 距离;ROI 分类
中图分类号:TP391.4 文献标识码:A
Feature Selection and Classification Algorithm for Region of Interest
in Lung Cancer CAD System
WEI Ying, GUO Wei, SUN Yue-fang, ZHAO Da-zhe, JI Ce
(College of Information Science and Engineering, Northeastern University, Shenyang 110004, China)
Abstract: Feature selection and classification of region of interest (ROI) is investigated in this paper. Firstly, several
features of ROI are extracted according to medical symptoms, and in order to improve the classification accuracy, these
features are selected by their separability of probability distribution. Secondly, the selected features are described quantita-
tively by SVM. Quantitative feature parameters are used to improve Mahalanobis distance with weight, and the improved
Mahalanobis distance can enlarge the difference between the two ROIs. Finally, ROIs are classified into nodule and non-
nodule by the improved weighted Mahalanobis distance. The presented ROI feature selection and classification algorithm
is used in lung nodule detection experiment. The experiment results indicate that the detection sensitivity is 94.6% and the
omission diagnostic rate is 5.4%, and the presented algorithm can provide doctors with helpful information for early stage
diagnosis of lung cancer.
Keywords: lung cancer computer-aided diagnosis (CAD); region of interest (ROI); feature extracting; separability
of probability; feature selection; weighted Mahalanobis distance; classification of ROI
1 引言(Introduction)
肺癌是当今对人类健康与生命危害最大的恶
性肿瘤之一.CT 扫描已经成为早期肺癌筛查和诊
断最重要的手段,但是 CT 扫描产生的图像量很
大,大量的 CT 图像直接导致医生工作量的增加,
从而增加了漏诊和误诊几率,医生读片时有高达
30%的机率可能疏漏有诊断意义的肺部结节.基于
医学影像的计算机辅助诊断(Computer-Aided Diag-
nosis,CAD)技术,利用先进的计算机软硬件分析
CT 图像,以发现并检测出病变特征,提醒医生注
意观察.经过 CAD 系统筛选减掉了占绝大部分的
正常影像,可以大大减少医生的工作量,能有效地
帮助医生对潜在的肺癌进行早期诊断
[1,2]
,提高诊
断准确率、减少漏诊的发生,对提高肺癌的诊治水
平具有重要意义.
多数肺癌是以肺结节的形式表现的,肺结节
通常是指直径小于 3cm 的类圆形病灶,肺结节的
检测是肺癌 CAD 中的核心问题之一
[3∼6]
.但是,
肺结节形态各异、分布位置不定、易与其它组织
粘连,在 CT 图像上特征不明显,有时即使是好医
生也难以做出判断.因此,肺结节检测算法是肺部
基金项目:国家自然科学基金资助项目(60671050);辽宁省自然科学基金资助项目(20052021,20072025).
收稿日期:2008-01-21