大规模图像集中的对象定位技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lxg19841130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种图像采集设备的普及,图像资源日益剧增。如何在大规模图像集中快速地找到并定位某个对象,是实际应用中需要解决的技术难题。对象定位技术一直是多媒体技术领域的热点,但针对现实应用中的图像资源往往具有数量大、类别多的特点,一直缺乏高效的解决方案。目前对象定位技术的相关研究比较多,主流的技术均基于滑动窗口或霍夫变换方法。但这些方法都是针对小规模、单类别对象的定位技术,面向大规模、多类别时,不仅无效处理多,而且定位效果也有待提高。本文提出了将图像分类技术引入对象定位处理的技术思路,利用对象定位处理的特定应用场景,改进了多示例多标记(MIML)学习框架下的示例包生成方法,提高了图像分类标注的效果;同时提出了两种融合分类结果的对象定位方法,都取得了比较好的实验效果。本文的具体工作内容如下:1.针对大规模、多类别图像集上对象定位问题,提出了利用图像分类信息来提高定位效果的解决思路。图像分类和对象定位是对图像的不同解读,两者的分析处理结论具有独立性,往往可以相互裨益。本文通过在对象定位处理中引入图像分类信息,为大规模、多类别图像集上的对象定位问题提供高效的解决方案。2.对于大规模图像对象定位任务中的图像分类问题,采用了高效的MIML学习算法,并且利用训练集图像中已知的区域标记信息,设计了一种新的示例包——Multi-bow包,使得MIML算法可以汲取更多有用信息用于学习,从而提高图像分类的精度。多个MIML算法的实验结果表明:MuIti-bow包带来的分类效果优于传统的SBN包。3.为提高图像中对象定位技术的处理效果,对对象定位技术和分类技术的融合方式进行了研究,提出两种融合的方案。针对大规模、多类别的图像对象定位问题,提出了先进行快速分类,再精确定位的处理方案;针对高精度对象定位需求,提出了融入全局分类信息的最优框打分机制。实验结果显示,前者在缩短处理时间的同时取得了不错的定位平均精度,而后者对最优框得分的改进也在多个类别上带来了定位效果的提高。实验结果表明,图像分类信息确实能为对象定位带来更好的效果。在上述技术研究的基础上,本文设计实现了一个图像对象浏览原型系统。用户可以设置系统需要考虑的对象类别、需要浏览的图像库,原型系统为其提供图像库的对象浏览模式。
其他文献
该文郑重论述了进行气(汽)质能源监测的研究和开发,包括一次检测仪表的选定、数据采集点设计(即以"能源平衡"的观点,采取"三级布点"的方法,以保证整个系统的精度).其次论述了
"故障树"是用以表明产品中某些组成部分的故障模式或外界事件或它们的组合将导致产品发生给定的故障模式的逻辑图.该文介绍使用故障树分析软件系统的方法.通过介绍故障树的基
机群系统负载平衡的基本目标是通过任务调度,使运算均衡地分布到各个结点上,从而提高系统资源(主要是CPU)利用率.它的调度策略直接影响了程序的运行性能. 负载平衡的目的主要
该文在分析异质数据库共享集成系统的特征和功能需求的基础上,提出了一种基于Web的异质数据库共享集成系统的体系结构,包括表示层、WWW服务器层、事务管理层和数据库层的四层
校园办公自动化系统是应学校的要求为实现校内办公自动化而设计开发的.作者负责了系统的整个设计开发过程,并实现了主要模块.该系统主要提供基于校园网的公文信息管理及查询,
该论文以"数据业务管理系统"为背景,详细论述了分布式系统的基本技术、设计方法以及其应用领域;阐述了软件组件结构的设计思想和基础理论;重点研究了基于CORBA的分布对象技术
审计系统作为安全操作系统的一个重要组成部分,对于监督系统的正常运行,保障安全策略的正确实施,构造计算机入侵检测系统等都具有十分重要的意义.该文旨在论述审计系统的设计
CORBA作为分布式对象的规范,综合了分布式计算和面向对象技术的优点,能够有效地解决电子商务所面临的异构平台间通讯的问题.此外,CORBA类似于"软件总线"的特点,能够方便地把
该文在认真分析研究有关资料并对一些具有代表性的关联知识挖掘法算法剖析的基础上,探讨了大型数据库中挖掘关联知识的理论和方法,提出了由应用图论理论与方法建立的频繁项集
该文集中研究了模糊控制对神经网络和遗传算法的算法改进及其在电力系统的负荷预测和电网规划等问题的应用.该文共分九章:第一章综述了神经网络、模糊控制和遗传算法理论的发