基于Gabor小波和卷积神经网络的图像识别方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:shenglove5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别、人脸识别、生物医学图像识别等图像识别技术在诸多计算机视觉领域有重要的应用价值,准确高效的图像识别是当前模式识别领域的热门研究课题。传统基于Gabor小波的图像识别方法提取的特征向量维度高,识别效果较差;近年来基于深度学习的图像识别方法取得了较好的识别效果,但仍然存在模型复杂度高、训练时间长、对外界环境变化鲁棒性差等问题。本文在对Gabor小波以及卷积神经网络深入分析的基础上,针对基于Gabor小波和卷积神经网络的图像识别进行研究。本文主要的研究工作与创新点如下:
  1)为降低高维Gabor特征对识别系统实时性的影响,同时提高特征对旋转、灰度变化的鲁棒性,本文提出了一种基于二进制编码Gabor特征的人脸识别方法。首先采用Haar-Adaboost分类器进行人脸检测,根据Dlib检测的68个人脸关键点进行姿态矫正。接着,采用不同参数的Gabor小波提取人脸多方向、多尺度的Gabor特征。为降低Gabor特征的维度,将同一尺度、不同方向的Gabor特征通过二进制编码的方法进行融合,进一步通过主成分分析(PCA)和线性判别分析(LDA)进行降维。最后,采用支持向量机(SVM)作为分类器,在FERET人脸数据库上进行了识别率的实验,证明了所提方法在小规模数据集上的有效性。
  2)相较于传统模式识别领域的特征描述子,神经网络缺乏特定领域知识,只能基于海量数据进行参数学习提取特征,因此往往对应着大量的训练时间和较高的模型复杂度。为提高卷积神经网络的训练效率和识别性能,本文提出了一种基于增强型Gabor特征和卷积神经网络的图像识别方法。首先,使用不同参数的Gabor小波提取图像Gabor特征以引入领域先验信息。接着,将多尺度、多方向的Gabor特征与图像灰度图进行融合构建增强型Gabor特征。最后,采用增强型Gabor特征作为卷积神经网络的输入。此外,Gabor小波的部分参数也可以通过网络学习进行更新,从而降低 Gabor 小波的参数设置对识别性能的影响。在MNIST数据集上的实验表明,采用增强型Gabor特征替代原始图像作为网络的输入可以为网络学习提供高效的浅层特征,进而提高算法的识别性能。
  3)为提高卷积神经网络对图像空间变换的鲁棒性,本文提出了一种基于Gabor卷积神经网络的图像识别方法。首先,为结合Gabor小波和卷积层的优良特性,设计Gabor特征提取模块、并行卷积模块和空间变换池化模块。接着,根据图像识别任务的应用场景,选取合适的模块构建相应的Gabor卷积层。最后,使用Gabor卷积层替换基准网络中的传统卷积层,搭建相应的Gabor卷积神经网络,从而将 Gabor 小波的空间局部性和方向选择性融入到卷积神经网络中。在MNIST、MNIST-rot、MNIST-scale、SVHN、CIFAR、LFW等数据集上的实验结果表明,所提算法可以提高网络识别性能,同时加强卷积神经网络对旋转、尺度变换等空间变换的鲁棒性。
其他文献
随着计算机网络控制技术的发展,控制设计人员不仅要解决底层设备的实时控制问题,还要解决上层数据集成管理所带来的综合自动化问题。港口调度与管理是保证港口装卸作业按计划组织实施而进行的一系列部署、指挥、检查、监督、协调和平衡的总称,直接影响企业的经济效益。本文针对我国某内陆港口生产作业环节多,作业流程复杂,建立了散杂货码头和油港码头多资源协同调度优化问题的数学模型,对四种现代启发式求解算法进行了实验研究
随着通信、计算机和人工智能相关技术的发展,以及任务场景复杂度的加深,多智能体(Multi-agent)系统的编队包围控制已经成为了一个热门的研究领域。多智能体的编队包围控制要求智能体的状态保持一致,并且系统对特定感兴趣的目标形成一定的编队队形。目前,基于测量的编队包围控制存在以下问题:忽略了部分智能体不能够测量到与目标间的相对位置信息这种情况。而在该情况下,已有的编队包围控制器难以满足编队包围的要
学位
随着科技的迅猛发展和信息化时代的到来,图像描述生成任务在跨模态内容检索、人机交互、机器人导航等研究领域和电子商务、儿童教育等应用领域具有深远的研究意义和广阔的应用价值。传统的图像单句话描述生成模型由于单句话涵盖能力有限具有细节描述缺失和个体偏差的问题,密集字幕生成模型由于分立短语关联性弱具有物体间关系缺失和无法高效人机互动的问题,故本文将研究重点放在段落级的图像描述生成上,旨在解决上述问题,生成细
学位
近年来,生物特征识别技术已经受到越来越多的研究和关注,它可以为我们提供一种有效且可靠的个人身份识别方法。作为一种相对较新的生物特征,掌纹识别由于具有分辨力强、对用户友好、特征丰富等特点近来受到越来越多的国内外学者的关注。虽然二维掌纹识别具有易于采集、成本低的优点,但是二维掌纹图像容易受光照变化、角度翻转以及表面脏污的影响且可能被伪造的假手掌欺骗。三维掌纹识别技术在一定程度上克服了上述二维掌纹识别技
学位
闸机作为城市轨道交通线网运营管理中重要的交互设备之一,其通行控制的性能直接关系到乘客的出行体验和企业的票务收益。随着城市轨道交通迈入“网络化运营”时期,城市轨道交通承担着越来越繁重的城市客运工作。现有的基于红外传感器的闸机乘客通行行为识别算法已经难以满足复杂场景下的检测需求。如何高效地提取出更为完整的乘客通行时的姿态特征,从中检测并识别出乘客的通行行为,以避免客流量较大时的各种问题和风险,具有重要
学位
随着科学的发展和技术的进步,人工智能成为最热门的科技话题之一,越来越多的人工智能产品从理论研究走向实际应用。家庭生活的各个角落也都出现了人工智能的踪迹,从手机到电视,从音箱到冰箱,从扫地机器人到服务机器人,人们的生活发生了翻天覆地的变化。语音交互作为一种重要的人机交互形式,常被用到智能家居中。为了使智能家居产品实现更加自然、高效的人机交互,让其能够感受和分辨人的情感,家庭环境中语音情感识别的实现具
随着计算机技术的飞速发展,深度学习技术在各领域的应用日益广泛,但是对抗样本的出现,给人工智能安全领域敲响了警钟。研究表明:深度神经网络具有天然的漏洞,非常容易受到对抗样本的攻击。精心设计的对抗扰动可以让图片产生人眼难以辨别的差异,但却会令神经网络面模型做出错误的分类。早期的对抗攻击技术仅局限于数字世界中,近几年,以对抗补丁为代表的对抗攻击技术正向物理世界中发展,攻击的目标也由分类模型向目标检测模型
学位
目标检测是计算机视觉领域一个热门问题,它不仅广泛地应用于工业检测和智能驾驶等实际场景,也对解决人脸检测和实例分割等更复杂的视觉问题有着重要的作用。  近年来,随着深度学习的发展,深度神经网络凭借其强大的特征提取能力和优异的表现性能被广泛地应用于目标检测任务当中,诞生了一些经典算法,并在相关领域展现出了巨大的应用价值。然而,尽管目标检测算法已经取得了巨大的成功,却仍然在尺度变化、采样等方面存在着巨大
学位
实际工程系统中往往存在未知参数、时变时滞等干扰因素,这些因素不可避免地对系统的控制效果产生影响。如何针对此类系统设计输出反馈控制器值得研究。本文基于齐次系统理论、Lyapunov稳定性理论、动态增益技术以及增加幂积分法,研究一类具有未知齐次增长率的非线性系统的输出反馈控制问题。论文主要工作如下:  1、针对一类具有时变时滞的非线性系统,考虑其全局输出反馈控制问题。由于非线性项满足上三角结构的齐次增
分布式传感器网络在环境监测、机器人协同工作、无人机编队飞行等民用和国防领域具有广泛的应用。在分布式传感器网络中,由于不同技术和部件之间的互联,以及传感器等智能体之间的互联,传输的数据容易受到攻击,从而导致传感器网络的运行遭到破坏。为了能够有效地抵御外部恶意数据注入的影响,本文设计了一种带有攻击检测的分布式滤波算法。该攻击算法可以有效识别虚假信息,维持系统安全运行。同时,考虑到攻击检测器的引入会使传
学位