基于多对象关系的图像识别研究

来源 :西南大学 | 被引量 : 0次 | 上传用户：xiaohuimin

【摘要】

：

随着多媒体技术的迅猛发展,图像和视频信息已经渗透到人们日常生活的方方面面,并且图像识别技术在近年来被广泛应用,在不同领域里占有着极其重要的地位。同时,图像和视频数据

【作者】

：

秦亚岚

【出处】

：

西南大学

【发表日期】

：

2004年期

【关键词】

：

多对象关系对象识别 BLSTM-RNNs 上下文遗传算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着多媒体技术的迅猛发展,图像和视频信息已经渗透到人们日常生活的方方面面,并且图像识别技术在近年来被广泛应用,在不同领域里占有着极其重要的地位。同时,图像和视频数据的迅速增长也促进了计算机视觉、模式识别和人工智能等相关领域的持续发展。图像识别作为计算机视觉领域中一个重要的分支,被广泛应用到航空航天领域、军事领域、公共安全领域、工农业等相关领域,具有广泛的应用价值。尽管当前图像识别的研究取得了一定的成果,但由于特征提取及识别算法的局限性,使得图像识别面临较大的困难和挑战。本文研究基于多对象关系的图像识别方法。首先利用对象分类器得到图像中的候选对象探测窗口。其中,所获得的对象探测窗口包含该探测窗口所属对象类别的标签信息、该探测窗口的位置信息及该探测窗口的得分信息。同时,本文根据高阶纯相关模型及贝叶斯公式获得图像中对象探测窗口之间的语义上下文、空间上下文及尺度上下文,并根据获得的对象探测窗口之间的语义上下文、空间上下文及尺度上下文信息构建对象关系图。且语义上下文、空间上下文及尺度上下文均属于局部上下文。为了获得图像的全局上下文,本文实现了一种双向长短时记忆循环神经网络(BLSTM-RNNs)模型。该模型将图像中所有候选探测窗口信息及图像的Gist特征作为输入数据,由于不同图像所获取的对象候选探测窗口的数目可能不同,BLSTM-RNNs模型能够有效地解决变长序列输入的问题。通过在训练数据集上训练BLSTM-RNNs模型,得到与每个对象探测窗口对应的BLSTM单元的前向隐藏层状态和后向隐藏层状态,并对获取的所有前向隐藏状态和后向隐藏状态计算加权平均,该均值融合了探测窗口序列中任一个探测窗口在探测窗口序列中的上下文信息,即图像中对象探测窗口序列的全局上下文特征。最后将该全局上下文特征与图像的Gist特征进行级联作为图像的全局上下文特征。最后本文采用遗传算法来完成基于多对象关系的图像识别。在本文的模型中,适应度函数是由对象关系图中单个对象的适应度、有边相连的两个对象之间作用的适应度及有团包围的多个对象之间作用的适应度构建的。其中,对象关系图中的对象即染色体中的基因,单个对象的适应度可以由探测窗口的得分、探测窗口的位置信息及上述得到的图像全局上下文特征确定,而两个及多个对象之间的适应度需结合构建的对象关系图来确定。在随机生成初始化种群后,根据该适应度函数去评估种群中每一个染色体的质量,适应度函数的值越大,那么质量就越高,然后筛选出精英染色体互相交配,自身变异等方式生产后代。经过了若干代后,精英中的精英就有可能存活,而不是精英的就会被逐渐淘汰,那么最后一代存活中的精英就是我们想要的最优解,即最有可能是正确的对象探测窗口组合。我们在标准图像库SUN09上验证本文所提出的算法的有效性,SUN09图像库中包含丰富的多对象关系。实验结果表明,本文提出的基于多对象关系的图像识别方法能够获得优于其他方法的识别效果。

其他文献

无线传感器网络上的分布式非负参数估计算法研究

无线传感器网络(wireless sensor network,WSN)作为一种特殊的自组织分布式网络,具备成本小、功耗低和体积小等众多优点,广泛应用于环境监测、工农业控制和城市管理等领域。

学位

无线传感器网络信号处理分布式算法非负参数估计

中空镍基磁性纳米复合材料的合成及其催化和吸附性能的研究

中空纳米结构是指一类在固体壳内具有空隙的纳米颗粒,近年来由于其与中空形态相关的独特性质而引起了越来越多的关注。中空纳米结构具有一些独特的特征,如大的比表面积,低密

学位

聚苯乙烯磁性聚多巴胺催化吸附

基于氢键作用的超分子聚合物的制备及性能研究

超分子聚合物是通过非共价键作用相互结合形成的聚合物。其中包括基于氢键作用的超分子聚合物,而2-脲基-4-嘧啶酮（UPy）的四重氢键体系就是通过氢键作用将聚合物结合在一起,从而

学位

聚异戊二烯2-脲基-4-嘧啶酮氢键作用纳米纤维素自愈合

轮腿复合式矿井救援机器人设计与研究

2019年1月份,国家煤矿安监局公告《煤矿机器人重点研发目录》指出:鼓励支持煤矿企业与国内外科研单位、机器人制造企业开展合作,推进煤矿安全发展,目录中第三十七类为矿井救援机器人。针对复杂矿井环境对救援机器人的运动要求,设计了一种新型腿轮复合式矿井救援机器人,并将其命名为Mine-Titan。Mine-Titan机器人具有可伸缩的前、后轮腿和腰部转动功能,可跨越大多数矿井巷道常见的障碍物,具有良好的

学位

矿井救援机器人可伸缩轮腿越障分析运动学动力学

基于认知特征和流形排序的图像检索研究

近年来视觉图像在互联网和移动终端的急速增长,以及其潜在的巨大商业价值,使得图像检索一直是计算机视觉领域的研究热点。而图像数据的海量性、复杂性和多样性也给视觉图像的

学位

视觉特征流形排序格式塔心理学图像检索

MDP框架下无线多媒体业务传输的资源优化研究

随着信息化时代和移动通信技术的高速向前发展,多媒体业务服务作为信息化建设不可或缺的组成部分,逐渐成为通信系统中的业务主体。面对社会对多媒体数据业务服务质量逐渐提高

学位

多媒体视频业务资源优化服务质量缓冲辅助中继在线学习约束马尔科夫决策过程

《招募、面试、甄选和入职培训》（节选）汉译实践报告

近年来,我国经济发展迅速,各类企业如雨后春笋层出不穷,人才需求量显著提高。与此同时,就业问题也吸引着整个社会的目光。在此背景下,本次翻译实践报告选用了《招募、面试、甄选和入职培训》一书的前两章。它为企业招聘和毕业生择业提供了有价值的信息,有助于在校生培养职业技能以适应社会的需要,使毕业生与企业实现双赢,具有很高现实意义和翻译价值。本报告共分为四个章节,第一章为任务描述,笔者主要介绍了本次翻译任务的

学位

人力资源管理信息文本交际翻译理论翻译方法

铁路RAIM可用性预测系统的设计与实现

随着GNSS卫星导航系统的不断发展,其在高速发展的铁路领域中的应用也不断发展。使用GNSS卫星导航系统的同时也存在着易受干扰和卫星完好性的问题。使用卫星导航时的卫星信号

学位

列车定位全球卫星导航系统接收机自主完好性检测RAIM预测

基于OpenStack的资源调度机制研究

云计算技术在大数据时代完全颠覆了传统数据计算存储模式,是一种新型的计算服务模型,随着云计算服务的用户越来越多,数据中心规模也越来越大,数据中心的资源利用率低和能耗问

学位

云计算OpenStack资源调度虚拟机放置虚拟机迁移

高光谱图像NRS分类算法GPU加速研究

高光谱仪器的成像原理决定了其成像数据能容纳更多地物特征,信息丰富,这给地物分类带来了极大的便利,但同时也导致分类算法运行速度慢、耗时长。传统的遥感图像分类方法难以

学位

高光谱图像分类NRS算法GPU并行优化CUDA

基于多对象关系的图像识别研究

其他学术论文