论文部分内容阅读
CNN(Convolutional Neural Networks)能够自动学习图像的高级语义特征,广泛的应用于图像处理领域中。快递logo是用来标识快递公司的重要标志,快速精准的对快递logo进行识别是快递智能一体化的关键。然而快递图片背景复杂,快递logo目标较小。如何在复杂场景中识别出小目标是图像识别技术的难点。论文从快递logo小目标识别着手,采用CNN网络建立具有强大识别能力的S-SSD模型,对复杂场景下的目标识别开展深入研究。 论文的主要研究内容和创新性成果如下: 1、对CNN网络的基础理论进行深入研究。充分研究卷积网络的基本架构;分析不同卷积对网络的优化以及目前卷积网络的评价标准。总结分析目前CNN网络以及目标检测识别的发展现状。 2、提出了SReLU激活函数。当x>0时,SReLU和ReLU的形式一致。当x<=0时,SReLU与Swish的激活形式一致。论文从理论上阐述SReLU激活函数的特性。论文在Mnist数据集及Cifar-10数据集上进行了实验,实验结果SReLU激活函数相比于ReLU的测试正确率有小幅提升。同时在Cifar-10数据集上分析了不同激活函数分别用于不同模型时的正确率,实验结果表明SReLU激活函数在ResNet中表现能力仅次于Swish,在ALexNet和DenseNet模型中表现最佳。 3、针对复杂场景中的小目标识别提出S-SSD网络模型。S-SSD模型通过多尺度的卷积及反卷积来提高模型的特征表达能力。论文在S-SSD模型中提出Sel卷积模块,通过多尺度的卷积增强模型的表达能力;同时在S-SSD模型中反卷积层模块来增强对小目标的识别能力。 4、采用WGAN(Wasserstein Generative Adversarial Net)进行数据增强。为调节正负样本的比例,论文首先对原图进行裁剪和镜像使得数据集的大小增强8倍,然后采用WGAN网络生成1/64裁剪的图像数据,以丰富图像特征的多样性,增强模型的鲁棒性。WGAN网络数据增强后数据集的数据大小变为原来的16倍。论文最终使用Adam算法训练模型。S-SSD模型的硬件平台为PC+GPU;软件平台为Python+Tensorflow+OpenCV。 实验结果表明S-SSD网络模型相对于SSD(Single Shot MultiBox Detector)模型其识别正确率尤其是对小目标的识别正确率有明显提升;在S-SSD模型中采用SReLU激活函数时,模型的识别正确率最高。S-SSD在保证网络正确率的前提下满足实时处理的需求,同时对小目标的检测能力强。