基于深度神经网络的图像特征表示方法研究

来源 :国防科技大学 | 被引量 : 1次 | 上传用户:thonary09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像特征表示是计算机视觉的重要研究内容,在视觉数据检索、自动驾驶、拷贝视频检测等领域有着广泛应用。随着大数据时代的到来,视觉数据呈爆炸性增长趋势,迫切需要通过图像特征表示方法,对海量的视觉数据中的语义信息针对不同应用构建精细的特征表示和理解。这种迫切的需求促使了传统机器学习方法的变革,深度学习技术也应运而生。本文结合视觉数据的层次化表示框架,在深度神经网络框架下,针对不同应用背景下图像特征表示技术中存在的不足提出了不同模型。本文将图像特征表示方法研究按照不同应用背景分解为三个研究问题:图像块级特征表示,图像级特征表示以及图像序列特征表示。具体地,本文的主要创新点及取得的研究成果包括:(1)提出了一种基于多尺度特征聚合的图像块级特征表示模型。现阶段的深度图像块级特征表示大多基于深度网络框架,但由于CNN网络结构模型约束,使得基于学习的特征描述子在尺度问题上表现不佳。受骨架检测和物体检测在处理物体多尺度问题上解决思路的启发,本文利用CNN网络结构不同层的特征图对应不同大小感受野的特点,提出对网络多个不同尺度的特征图进行融合学习来有效地整合不同尺度、不同层次的特征,从而构建具有较强尺度鲁棒性的图像块级特征表示模型。首先利用CNN对单个图像块信息进行编码,然后通过批量数据建造方式来建立图像块之间的匹配和约束关系,以此来学习具有强表达能力和强鲁棒性的特征描述子。在实验阶段,本文提出的模型分别在图像块匹配、图像检索、宽基线三维影像等多个数据集及对应的评价指标下进行评测,实验结果表明本文提出的模型在显著提升描述子的描述能力同时,具有了较强的尺度鲁棒性。(2)提出了一种基于局部二值的旋转不变图像级特征表示模型。卷积神经网络在计算机视觉领域取得了前所未有的成功,但它们仍然面临着如何使用较少的参数情况下,有效处理物体方向变换问题。在本文中,我们提出了一种新的卷积模块,局部二值方向模块(LBoM),它利用局部二值卷积滤波器和主动旋转滤波器来有效地处理目标的旋转变化,网络中参数量更少。LBoM可以自然地插入到当前最有效的CNN模型中,并将它们升级为旋转不变局部二值卷积神经网络结构(RI-LBCNN)。RI-LBCNN可以基于现有的网络优化算法,以端到端的方式进行网络训练,并完成图像分类任务。在四个标准数据集上的大量实验结果表明,RI-LBCNNs可以使用较少的网络参数来完成图像分类任务,并且在处理具有较大旋转变化的图像时性能显着优于LBCNN方法。(3)提出了一种基于CNN的图像序列特征表示,并与图序列匹配算法结合构建了一种拷贝视频检测模型。现阶段拷贝视频检测算法大多采用传统手工设计特征,非常依赖手工特征设计者的领域知识和经验。本文介绍了一种基于深度CNN的图像序列特征表示方法,并结合图序列匹配算法构建基于内容的拷贝视频检测框架模型。首先,采用深度CNN特征来对视频数据中图像序列的视觉内容进行编码,用来保持图像帧级别的辨别能力。通过计算图像序列深度CNN特征之间欧式距离,得到帧之间的相似性,本文提出了一种基于关键帧的拷贝检索方法。该方法在不建立关键帧索引的前提下,可以从大型关键帧数据库中检索到候选拷贝关键帧。此外,基于视频数据的时序一致性约束,本文采用基于图的序列匹配算法来获得拷贝视频片段并对拷贝视频片段进行准确定位。实验结果表明,本文提出的深度CNN图像序列特征表示算法具有很强的辨别能力,也验证了本文提出的拷贝视频检测算法的有效性。
其他文献
在工程项目建设中,成本控制不仅是重要的管理目标之一,而且其工作质量很大程度上决定企业的经济效益。同其他水利水电建设项目相比,抽水蓄能电站机电安装项目具有周期长、成
建筑业作为我国国民经济的重要支柱产业,凭借其从业门槛低、市场需求大等特点吸纳了5500多万劳动力人口,占就业人口总量的7.1%,为解决我国民生就业问题做出了突出贡献。然而
目的种植义齿是牙齿缺失的重要的修复方式,但临床上经常面临种植区域骨量不足的情况,需实行骨增量手术保证种植体周围足够的骨量。自体块状骨移植是牙槽嵴骨量不足时常用的骨增量技术。根尖区作为块状骨移植的取骨位点可避免开辟额外术区,实现手术的微创操作。本研究拟通过测量分析上颌切牙缺失患者的锥体束CT(Cone-beam computed tomography,CBCT)影像,评估上颌切牙根尖区作为块状骨移植
改革开放以来,我国经历了三四十年的高速经济增长,伴随着人口红利的不断释放和民营经济的持续繁荣,我国在城镇化发展道路上取得了举世瞩目的成就。当期我国正在进入经济社会
读图时代,随着虚拟场景不断丰富,美图式社交也成为重要的信息传播方式之一。人们在社交媒体尽情晒照,“理想自我”与“现实自我”不断交织,个体在自我呈现的同时也建构着自己的社交关系。故而本文基于三重自我建构理论,选取了30位大学生为研究样本,通过深度访谈法,分析美图这一视觉修饰技术赋能个体的认知范式和交往模式的改变,以及个体自我、关系自我、集体自我的认同建构过程。研究发现,个体建构了“理想自我”,并持续
旅游目的地形象在很大程度上决定旅游者的出游意愿,是旅游管理部门发展旅游目的地经济必须考虑的重要因素。在当今的新媒体传播语境下,借助新媒体塑造旅游目的地形象成为愈发普遍的现象,且会直接影响到旅游目的地的旅游经济。本文研究的重点在于以下几个方面,第一、新媒体在旅游目的地的形象塑造中越来越重要;第二、利用新媒体手段,塑造旅游目的地的形象还存在一些问题;第三、针对所出现的问题,要有改变的策略。因此,本文提
本文对茅口灰岩下山掘进中各种可能发生淹井的情况进行了分析并提出了处理方案。
1月24日长江枯水不枯。武汉关最高水位18.93米,为武汉有水文记载以来枯水期最高水位,比历史年均值高4.52米,比同期最高水位(1869年,水位18.59米)高0.34米。 January 24, the
车家坝河是长江二级支流,位于三峡水库云阳县和奉节县境内,河流发源于云阳县桑坪镇的望乡台一带,自北向南流经团坝乡、桑坪镇,进入奉节县境内,在野茶乡附近折向东流经大寨乡,
近年来,太仓海事局在部海事局的统一部署下深入贯彻落实“放管服”改革,并将电子政务作为推进海事行政审批制度改革的重要载体。依托“互联网+政务服务”理念,中国海事局开发