【摘 要】
:
图像分类与检测属于计算机视觉领域重要的研究课题。本文首先研究图像分类问题,然后进一步深入研究图像目标检测。对于图像分类问题本文选择脱机手写汉字识别来进行研究。对
论文部分内容阅读
图像分类与检测属于计算机视觉领域重要的研究课题。本文首先研究图像分类问题,然后进一步深入研究图像目标检测。对于图像分类问题本文选择脱机手写汉字识别来进行研究。对于图像目标检测本文将分析现有的目标检测算法及其存在的不足,并对其进行改进。本文将基于深度学习中的卷积神经网络算法对脱机手写汉字识别和目标检测进行研究。主要研究内容如下:(1)由于传统脱机手写汉字识别的过程复杂、精度低;而常用卷积神经网络的特征信息提取不充分。因此,本文设计了网络模型CharacterNet。首先,通过多级堆叠的特征分组提取模块,提取图像的深层抽象特征信息,并进行特征信息之间的交流融合;然后,利用设计的下采样和通道扩增模块,在降低特征维度的同时保留图像重要信息。最后,将特征信息进行精炼和浓缩,来解决特征信息的重叠和冗余问题。本文使用包含3755个汉字的CASIA-HWDB(V1.1)数据集对模型进行训练和测试,实验结果验证了模型的有效性。(2)针对SSD目标检测算法平均检测精度低,尤其对小目标的检测问题经常出现漏检和误检的问题,本文基于VGG网络设计了多尺度融合的目标检测算法MFSSD。在算法中使用分步卷积拆分算法、反卷积、膨胀卷积下采样三种卷积操作来增强网络的细节特征提取能力,同时对网络的不同层进行特征融合,提高网络的上下层语义信息。最后,使用VOC数据集以及采集的校园实际场景图像分别对SSD和MFSSD算法进行检测,检测结果表明,MFSSD网络有效提高了SSD算法的综合性能。
其他文献
近年来随着科学技术快速发展,智能机器人的研究受到人们越来越多的关注。在智能机器人研究中,SLAM(Simultaneous Localization and Mapping)是需要解决的基础性问题。现在大
云存储服务的普及,使得数据属主(所有者)把数据存储到云服务器,从而节省了本地存储空间。数据属主若以明文的形式分享数据,则会泄露数据隐私;若以密文形式分享,则会带来如何
量子计算是量子信息处理领域的重要课题。作为实现量子计算的物理基础,量子计算机需要满足初始化、控制、相干时间、读出及可扩展性等方面的需求。金刚石中的氮空位(nitrogen
表面等离子体激元(Surface plasmon polaritons,SPPs)是一种电磁场局域于金属表面的电磁波形式,其沿着金属表面传播且在垂直于金属表面方向上呈指数衰减。SPPs能够打破传统光
当前,视觉地点识别在多种新兴科技领域中拥有重要的应用前景和科研价值,并成为模式识别中的热点话题。对于视觉地点识别而言,提升性能的一个关键问题是设计分辨能力更强同时
伴随着社交网络和用户自创内容的快速发展,目前互联网已经积累了海量图像数据,标志人们已经进入“读图时代”。如何满足人们准确、实时的图像检索需求,已成为亟待解决的现实
随着信息技术的发展,数字图像广泛应用到了人类生活的各个方面。高分辨率图像含有丰富的色彩和细节信息,不仅可以提供良好的视觉感受,并且可以为后续的各种图像处理任务带来
无线定位技术的不断创新和移动智能终端设备的大规模普及,大量与移动对象相关的轨迹数据被服务提供商(LBSP,Location Based Services Provider)以不同的形式保存下来。服务提
随着信息革命的深入推进,数据已经成为国家基础性战略资源。同时,数据安全超出了传统的安全范畴,上升到维护国家主权的高度。数字签名作为维护数据安全的重要技术之一,可以解
Schiff碱过渡金属配合物具有特殊结构,使其表现出生物活性、电化学及磁性等性质。所以,本文首先合成了6种含有金刚烷基Schiff碱,接着以这6种Schiff碱为配体,进一步合成了6种