论文部分内容阅读
目标检测与角度估计技术是数字图像处理研究的热门之一,伴随着深度学习框架的逐渐成熟,目标检测与角度估计技术在学术界掀起了一股新的热潮。此类技术被广泛应用于诸多场景中,然而在应对不同场景需求时,目标检测与角度估计技术经常遇到信息观测维度的问题:在某些有限的信息观测维度下观测,目标之间或目标与背景之间差异较小,进而导致分辨效果较差。因此为提升目标检测与角度估计效果,需要结合场景特点,在场景内寻找最有效的信息观测维度,以最大化类别之间的差异。
本文研究不同场景下的目标检测与角度估计方法,主要解决有限信息观测维度条件下的检测与角度估计问题,对特征与算法流程进行了技术创新,包括:医用图像贫血检测技术、声纳图像目标检测技术、声纳目标角度估计技术。具体研究内容如下
1.在利用眼睑结膜医学图像检测贫血的场景中,研究了色彩信息观测维度问题。为了推断眼睑结膜图像与血红素值的关系,进而检测贫血症状,本文分别提出了基于高色调比例特征的快速检测算法,基于特征甄选行为的学习检测算法与基于卡尔曼滤波与非线性惩罚回归的拟合算法。论文分析并量化了色彩相似图像的相似性,首先使用RGB与HSI色彩空间中的特征,提出基于高色调比例特征的快速检测算法;其次改进了HSI色彩空间中的特征,并引入特征甄选步骤和支持向量机/浅层神经网络提出基于特征甄选行为的学习检测算法;最后将回归算法引入到检测问题中,配合以修改的卡尔曼滤波寻找图像中的内部规律,并结合本文提出的一种风险等级评估办法量化统计结果,提出基于卡尔曼滤波与非线性惩罚回归的拟合算法。论文中使用医用结膜色彩相似图像数据评估以上算法。结果表明,本论文提出的算法能够找到有效的色彩信息观测维度,增加类别之间的差异。
2.在基于声纳图像的目标检测场景中,研究了形状信息观测维度问题。研究主要目的是从声纳图像较为复杂的背景中检测目标,本文提出了基于横纵特征向量与基于点聚集特性的算法串联机制的检测算法。具体内容为:为了去除声纳图像中的干扰,论文提出了一种基于二维小波分解的去除电磁干扰噪声的算法。算法首先找到高频分量以定位出噪声位置,并实施近邻去噪算法。为了解决声纳真实目标与背景噪声形状相似的问题,针对水下规则形状与不规则形状两大类目标,本文提出了两种检测算法:针对规则形状目标,本文采用Hough变换提取可疑目标块,并提出了有较高鲁棒性的横纵特征向量用于筛选真实目标;针对不规则目标,本文提出了一种基于点聚集特性的算法串联机制,首先根据点聚集特性提取可疑目标块,然后分别使用三类检测器,包括角点与支持向量机,高阶统计量与支持向量机以及卷积神经网络,有效排除背景干扰。利用AUV海试获得的声纳数据,评估声纳图像目标检测算法。结果表明,本文算法能够增加目标与背景噪声之间的差异,具有较高鲁棒性,并提高检测效果。
3.在基于二阶稀疏编码的声纳目标角度估计场景中,研究了形状信息观测维度问题。本文提出了基于二阶稀疏编码的角度估计算法。具体内容为:算法在原有稀疏编码的基础上添加了空间信息,并将图像分为四个象限,从每个象限提取标准差大的相同数量的图像块,对图像块白化预处理后,用稀疏表示方法进行第一阶训练,学习每个目标的子字典;之后对子字典进行整理,去掉无用基后合并为联合字典,并通过第二阶稀疏编码训练得到最终稀疏编码。在测试阶段,基于稀疏编码系数的稀疏性,算法将联合字典对图像块的最终稀疏编码汇总并表达为全局的图像特征向量,最终利用特征向量间的相关系数实现目标角度估计。为了更好地实现算法对声纳目标的角度估计,本文对图像数据预处理、空间图像块池化、稀疏编码参数、特征向量等改进方面进行了比较分析,并使用COIL-100数据库量化了改进效果,最后通过前视声纳多角度图像验证了算法的实用性。
论文结合多场景应用需求研究目标检测与角度估计方法,从色彩和形状等方面,丰富和完善目标检测与角度估计的信息观测维度,使用对应的数据对算法进行验证。结果表明:本论文中提出的算法在不同目标检测与角度估计场景中均能够达到良好的效果,具有较高的应用价值。
本文研究不同场景下的目标检测与角度估计方法,主要解决有限信息观测维度条件下的检测与角度估计问题,对特征与算法流程进行了技术创新,包括:医用图像贫血检测技术、声纳图像目标检测技术、声纳目标角度估计技术。具体研究内容如下
1.在利用眼睑结膜医学图像检测贫血的场景中,研究了色彩信息观测维度问题。为了推断眼睑结膜图像与血红素值的关系,进而检测贫血症状,本文分别提出了基于高色调比例特征的快速检测算法,基于特征甄选行为的学习检测算法与基于卡尔曼滤波与非线性惩罚回归的拟合算法。论文分析并量化了色彩相似图像的相似性,首先使用RGB与HSI色彩空间中的特征,提出基于高色调比例特征的快速检测算法;其次改进了HSI色彩空间中的特征,并引入特征甄选步骤和支持向量机/浅层神经网络提出基于特征甄选行为的学习检测算法;最后将回归算法引入到检测问题中,配合以修改的卡尔曼滤波寻找图像中的内部规律,并结合本文提出的一种风险等级评估办法量化统计结果,提出基于卡尔曼滤波与非线性惩罚回归的拟合算法。论文中使用医用结膜色彩相似图像数据评估以上算法。结果表明,本论文提出的算法能够找到有效的色彩信息观测维度,增加类别之间的差异。
2.在基于声纳图像的目标检测场景中,研究了形状信息观测维度问题。研究主要目的是从声纳图像较为复杂的背景中检测目标,本文提出了基于横纵特征向量与基于点聚集特性的算法串联机制的检测算法。具体内容为:为了去除声纳图像中的干扰,论文提出了一种基于二维小波分解的去除电磁干扰噪声的算法。算法首先找到高频分量以定位出噪声位置,并实施近邻去噪算法。为了解决声纳真实目标与背景噪声形状相似的问题,针对水下规则形状与不规则形状两大类目标,本文提出了两种检测算法:针对规则形状目标,本文采用Hough变换提取可疑目标块,并提出了有较高鲁棒性的横纵特征向量用于筛选真实目标;针对不规则目标,本文提出了一种基于点聚集特性的算法串联机制,首先根据点聚集特性提取可疑目标块,然后分别使用三类检测器,包括角点与支持向量机,高阶统计量与支持向量机以及卷积神经网络,有效排除背景干扰。利用AUV海试获得的声纳数据,评估声纳图像目标检测算法。结果表明,本文算法能够增加目标与背景噪声之间的差异,具有较高鲁棒性,并提高检测效果。
3.在基于二阶稀疏编码的声纳目标角度估计场景中,研究了形状信息观测维度问题。本文提出了基于二阶稀疏编码的角度估计算法。具体内容为:算法在原有稀疏编码的基础上添加了空间信息,并将图像分为四个象限,从每个象限提取标准差大的相同数量的图像块,对图像块白化预处理后,用稀疏表示方法进行第一阶训练,学习每个目标的子字典;之后对子字典进行整理,去掉无用基后合并为联合字典,并通过第二阶稀疏编码训练得到最终稀疏编码。在测试阶段,基于稀疏编码系数的稀疏性,算法将联合字典对图像块的最终稀疏编码汇总并表达为全局的图像特征向量,最终利用特征向量间的相关系数实现目标角度估计。为了更好地实现算法对声纳目标的角度估计,本文对图像数据预处理、空间图像块池化、稀疏编码参数、特征向量等改进方面进行了比较分析,并使用COIL-100数据库量化了改进效果,最后通过前视声纳多角度图像验证了算法的实用性。
论文结合多场景应用需求研究目标检测与角度估计方法,从色彩和形状等方面,丰富和完善目标检测与角度估计的信息观测维度,使用对应的数据对算法进行验证。结果表明:本论文中提出的算法在不同目标检测与角度估计场景中均能够达到良好的效果,具有较高的应用价值。