论文部分内容阅读
目标检测是计算机视觉领域中一个至关重要的研究子领域,在自动驾驶、视频监控、医学图像等行业有广泛的前景。但是由于小尺度目标在图像中占有的像素数量较少且缺乏有效特征,所以小尺度目标检测在目前仍然有一定的难度和挑战。本文将在深度学习的目标检测算法的基础上进行小尺度目标检测的研究和改进。本文以Faster R-CNN算法为基础进行研究和改进,提出了基于聚类的多层特征融合算法和基于双线性插值的Soft-NMS算法,并进行了实验。基于聚类的多层特征融合算法是在特征提取网络层模块上使用多层特征融合方法来使得提取的特征具有高分辨率和高语义的特性;而在候选区域生成网络层模块使用K-means聚类算法在无需先验知识就可以获得效果良好的锚框。基于双线性插值的Soft-NMS算法是在感兴趣区域层模块上使用双线性插值方法来使得输出的建议特征图的位置更加精确;而在分类层模块使用Soft-NMS可以更好的过滤检测框,防止误过滤检测框。基于上述所提出的两种改进算法进行对比实验,从实验的检测结果可知,两种改进算法的均值平均正确率与Faster R-CNN算法相比有一定的提升。综上,本文通过基于深度学习的小尺度目标检测研究与实现表明了基于聚类的多层特征融合算法和基于双线性插值的Soft-NMS算法的在小尺度目标检测上的可行性和有效性。