场景分类中上下文特征描述模型的研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:wangyuantianjin99se
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网飞速发展的今天,网络在给人们提供丰富信息资源的同时,也给海量图像数据的整理和归类带来了空前的难度。为此,各种图像分类技术应运而生,其中场景图像分类是该研究领域的一个重要分支。场景图像分类是通过计算机将表达场景属性的各种信息转化为具体的特征描述,并构建合适的特征表达模型,进而实现场景图像的自动标注和分类,广泛地应用在图像分析、整理、视频摘要及机器人导航等机器视觉应用领域中。
  场景图像是多个复杂信息的载体,其中变化多样的繁杂目标物之间,以及目标物与环境之间存在着复杂的隐含关系,反映了许多重要的语义联系,即上下文关系,这些关系往往较为隐蔽且多变,难以描述。可用于场景分类的图像特征大致分为低层视觉特征、中层语义特征、高层语义特征以及深度学习特征几大类。如何从这几类特征中获取可以充分表达场景语义的上下文关系,是提升场景分类准确率的关键因素之一。
  本文针对场景分类中存在的难点问题,紧密围绕场景图像的上下文关系,构建了合理有效的上下文特征描述模型,显著提升了场景分类算法的精度。
  本文主要工作和创新点如下:
  (1)场景的时频上下文特征描述模型的构建。针对仅利用空间时域特征,无法充分构建复杂的视觉字典,以及无法有效完成高层建模等问题,依据时域(空域)可描述场景结构,以及频域的不同子带可描述场景从概貌到细节不同特性的优势,充分考虑场景图像中不同目标细节存在的相互影响,建立时频上下文特征描述模型。利用相邻像素点及图像块之间隐含的上下文语义共生关系,通过小波变换得到场景图像不同尺度和细节分量的频域空间上下文信息,并结合DLBP(Different Local Binary Pattern)特征生成多尺度纹理描述子(Multi-scale Texture Descriptor,MSTD),构建时频上下文特征描述模型。该模型充分考虑了细节纹理特征和空间尺度信息,增强了单层特征的区分度,进一步揭示了图像内容之间的深层次互联关系,且模型构造相对简单,对光照和旋转具有一定的鲁棒性,室外场景的分类准确率都在84%以上,有效地提升了场景分类的精度。
  (2)场景的显著性上下文特征描述模型的构建。针对场景中目标物的数量和种类繁多,目标物之间以及目标物与环境之间的相互关系错综复杂,图像的拍摄角度不同等原因,造成的场景内容难以辨识,同类场景之间变化较大,而不同类场景之间有时具有高度的相似性等问题,依据场景图像在表达内容时,其核心信息的显著性起着关键的作用,本文构建了显著性上下文特征描述模型。通过优先检测图像的上下文显著性信息,充分反映场景图像内容的多尺度空间上下文关系,弥补了将场景中的目标物割裂开来并硬组合的缺点,同时结合Gabor变换对上下文视觉信息进行多尺度多方向地描述。在标准场景图像集上验证的实验结果表明,本文所建立的模型能够有效地克服拍摄角度和尺度的影响,提高了对于场景中目标物之间相互关系的描述能力。
  (3)场景的全局与局部上下文特征描述模型的构建。针对场景本身存在的结构复杂和多样性等特点,依据场景图像的全局特征用于描述目标间的相互关联关系,局部特征用于描述目标细节的原理,充分考虑图像中目标物的相对位置变化、遮挡以及背景混乱等干扰因素,建立全局与局部上下文特征描述模型。在上下文视觉敏感区域检测的基础上,将增强后的全局与局部特征进行加权,并相互融合,生成多尺度空间-频率融合特征,构建上下文特征描述模型。该模型有效地避免了精确分割目标物所带来的算法复杂度的提升,同时,能够很好地描述目标物之间的上下文关系,使目标物周围的背景区域也能够辅助分类判别。此外,避免了传统视觉词袋模型中对于空间信息的忽视,将传统的视觉单词改进为结合上下文的视觉单词,有效地减少了一词多义现象。在标准场景图像集上的实验结果表明,本文所建立的模型能够很好地区分具有相似目标物的不同场景,克服了遮挡以及背景混乱的影响,适用性强。
  (4)场景的上下文深度学习特征描述模型的构建。由于场景内容的复杂性和多样性,显性特征通常难以泛化,尽管利用深度学习提取的特征具有较好的泛化特性,但是单纯利用数据驱动训练得到的深度特征对场景核心内容通常表征不足。因此,为了获得场景图像的内涵泛化特征,本文通过结合场景中目标物之间以及目标物与环境之间的上下文关系,建立了特征驱动与数据驱动相结合的深度学习网络训练机制,从而构建了上下文深度学习特征描述模型。利用在大规模场景图像数据集Places上预训练的深度卷积神经网络,分别提取不同驱动模式下场景图像的多层深度卷积特征,对场景图像的高层上下文抽象语义信息进行深层描述。该模型将数据驱动与特征驱动相结合,有效地提升了分类的准确率,特别是对于复杂的室内场景,有着更好的区分力。在标准场景图像集上的测试结果表明,利用本文所建模型的分类结果优于同类许多先进方法。
其他文献
数字远程图像监控系统使得远方变电站真正实现了无人值守,极大地提高了电力系统的自动化程度。视频编码器的编码效率和工作稳定性对整个图像监控系统有着决定性的作用,其中的压缩编码算法决定了它的编码效率、图像质量。本文结合当今的高速器件DSP和FPGA,就小波变换用于图像编码进行了有意义的研究与实践。本文通过查阅大量的国内外文献,在绪论部分详细地比较了目前实现图像监控系统的各种压缩标准和硬件实现策略,最后确
学位
当前,越来越多的研究者关注对神经系统的研究。一方面原因是由于各种神经系统疾病给众多的患者带来痛苦;另一方面,人们也需要更深入地了解人脑的工作原理,以推动诸如人工智能等学科的进步。集微电子技术和集成电路技术于一体的神经细胞电信号探测系统凭借其多通道、大数据量、实验持续时间长、实时性强和使用方便等特点,成为一种可用于神经细胞集群网络特性研究的有效装置。本文研究了用于进行体外实验的CMOS神经元电信号探
学位
Bennett等人在1984年提出了量子密钥分发(QKD,Quantum Key Distribution)理论,QKD以量子物理与信息学为基础,可以为两个不同用户提供无条件安全的共享密钥,QKD是目前为止唯一被严格证明可提供无条件安全的保密通信手段。Bennett等人随后于1989年完成了世界上第一个QKD演示系统。在此之后,QKD的理论在世界范围内得到了广泛的研究,有关QKD的实验系统更为复杂
学位
随着信息时代发展,信息传输已经成为了至关重要的一环,天线的应用领域正在不断增加,对于天线也在不断的提出新要求。某些场景可能要求天线有足够宽的工作频带、或者需要天线在多个频段同时工作等特性,希望天线在工作频段内具有良好的辐射特性和辐射增益。同时也对天线的尺寸提出了新的期望,力求其趋向于小型化、集成化。因此研制出小型化、宽频带、高增益的圆极化天线具有极其重要的意义。本文的主要研究是基于Minkowsk
随着空天探测技术的发展和相机传感器性能的不断提升,线列扫描相机和凝视相机都得到了新的发展。线列相机从传统的单线列向多线列发展,凝视相机从传统小型凝视相机向大面阵凝视相机发展,从而可以获得帧间间隔更短的扫描相机观测图像和大视场覆盖并对感兴趣区域高帧频下传的凝视相机观测图像。但是也需要新的目标检测技术与新的相机探测体制相匹配。本文从新型相机探测体制出发,针对单帧红外弱小目标检测技术,高帧频成像红外弱小
学位
认知雷达是一种具有环境感知和自我学习能力、能够自适应调整发射波形的新体制智能化雷达。与传统雷达只能发射固定波形相比,认知雷达可根据实际场景中的目标和环境信息动态地调整发射波形,以可靠、有效和稳健地提高雷达性能。自适应波形设计是认知雷达的关键技术之一,为了在兼顾发射机效能的同时更好地提升波形设计的自由度,通常要求雷达波形具有较低的峰均比。因此,本文主要讨论峰均比约束下发射波形的合理设计问题,用以提升
学位
近几年来,被动(辐射计)毫米波遥感被认为是一种适合于许多安全相关应用的工具。这些是用于衣物下隐藏物体检测的人员筛选,或者是用于车辆或飞机的增强视野,仅举例子。辐射计仅具有记录自然热辐射功率的接收器,通常使用环境和宇宙背景辐射作为自然照明源提供场景的发射和反射特性。场景及其对象的被动签名根据目标及其散射特性以及实际的照明特性而有很大不同。一个例子被认为是辐射鉴别装置用于比较两个以下斑点的天线波束在远
由于物理条件的限制和安全因素等原因,需要满足硬约束条件的状态受限控制系统大量存在于各类实际工程当中.如何在保证满足状态约束的前提下,尽量提高系统的动态性能及鲁棒性等问题,无论在理论还是在应用上都有着十分重要的意义.近年来,在状态受限系统控制理论领域涌现出了许多新的方法,但是仍有很多亟待解决的重大问题.本论文将讨论几类典型的状态受限系统的控制方法及其应用问题,主要研究结果和贡献如下:  一、针对含输
非线性现象普遍存在于实际生产和生活中,所有的实际工程控制系统都是非线性的.因此,对非线性系统的反馈控制问题研究是控制理论领域的一个热点,具有重要的理论指导意义和实际应用价值.在实际工程中,系统状态往往并非全状态可测,这就需要研究输出反馈控制问题.本文针对几类不同的非线性系统,利用Lyapunov泛函方法、齐次方法、压制方法和采样控制方法等,设计出相应的输出反馈控制器和采样控制器,研究输出反馈镇定跟
近几十年来,随着数字计算机技术、通信技术和网络技术的快速发展,网络化控制系统因其便于维护和安装、拓展性好、各个环节信息交互可靠等优点,在许多实际工业生产中(如移动传感器网络、分布式电力系统、智能交通系统等)具有广泛的潜在应用价值。网络化控制可以通过有线/无线网络、智能传感器、数字技术、通信技术等手段将系统之间的各个环节通过计算机网络连接起来,从而实现高效的信息交互,更好地完成控制任务。与此同时,网