论文部分内容阅读
结肠癌是癌症致死的主要原因之一,它通常由结肠息肉缓慢发展而来。及时检测和切除结肠息肉,能够极大地降低结肠癌的发病率和患者的死亡率。采用CT结肠镜进行结肠息肉检测,不仅在检测过程中能够减轻患者的痛苦,而且在检测性能上能够与光学结肠镜相媲美。在CT结肠镜中对结肠息肉进行自动检测,不仅能够减轻医生的负担,而且能够提高诊断的精确度。本文研究CT结肠镜中的息肉自动检测关键技术,内容如下: (1)针对标记物引起的伪软组织(空气-标记物边界,ATB),本文提出了基于统计信息的标记物区域生长方法,与形态学中的腐蚀膨胀操作子相结合去除伪软组织ATB;针对标记物对软组织的退化作用,本文提出了基于水平集的分割方法,利用Hessian矩阵的特征值构造软组织增强函数,同时增强空气区域和标记物区域中的软组织,将增强函数融入到速度函数中去,减轻标记物对软组织的退化作用。实验结果表明,本文提出的方法的分割结果与手动分割的重合率达91.7%。 (2)针对疑似息肉样本集中正样本和负样本分布不平衡的问题,本文提出了基于不平衡数据集的息肉分类方法,采用SMOTE和Boosting相结合的方法,利用SMOTE增加少数类样本,来改善分类器对少数类的预测能力;利用Boosting来保证分类器对整个数据集的分类精度。实验结果表明,该方法训练的分类器的Precision值达0.796,Recall值达0.903,F-value值达0.846。 (3)为了满足息肉自动检测的实时要求,本文提出了Multiple-layer Boosting的算法,在设计分类器时,考虑特征的计算复杂度。根据特征复杂度的不同,级联分类器的第一层的强分类器由简单特征构成,在第一层就拒绝大部分的负样本,提高了检测的速度;后面层的强分类器则由所有的特征构成,保证级联分类器的检测率。级联分类器的第一层采用MRMR方法挑选出最大相关、最小冗余的简单特征,级联参数DR(DetectionRate)和FPR(False Positive Rate)采用Cascade indifference curve方法自动确定,来改善级联分类器的检测性能。最后的实验结果表明,本文提出的级联分类器对于检测直径≥5mm的息肉的敏感度(sensitivity)能达到90%,平均每例数据6个假阳。 (4)传统的离线训练分类器的方法,需要在训练之前获得所有具有代表性的训练样本,而且一旦分类器训练完成,就不能改变。如果要学习新样本,就必须重新训练分类器。为了解决这一问题,本文提出了在线训练结肠息肉检测器的方法。针对结肠CT数据的息肉样本集中正样本和负样本分布不平衡的问题,本文提出了在线非对称Boosting训练的方法,分别以决策树和朴素贝叶斯为基分类器在线训练结肠息肉检测器。实验结果表明,以决策树作为基分类器的在线Boosting分类器,在测试集上检测的假阳为33个,运行的时间为9.01s,其性能远远好于以朴素贝叶斯作为基分类器的在线Boosting分类器的性能。