基于主动学习的目标跟踪和检测

来源 :天津大学 | 被引量 : 0次 | 上传用户:bluebabyyejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在目前的机器算法研究与应用中,需要海量的人工标数据去训练模型。在计算机视觉任务中大量的标注任务不仅仅给研究者带来负担,而且标注的精度也并不总令人满意。这就使得要获得大量人工标注的数据变得非常困难,也让仅需少量标注样本的主动学习算法有了极大的发展空间。主动学习的关键就在于选择的策略,而目前的大部分策略都只适用于分类问题,目前还没有很多适用于基于深度学习的目标跟踪和检测领域的主动学习算法出现。所以本文针对两个不同的任务设计了不同的主动学习策略。
  对于目标跟踪任务,目前主流的孪生网络目标跟踪算法都是基于样本对形式的数据进行训练的,对此设计了一个基于时空一致性的主动学习策略,该策略可以很好的利用目标跟踪的时序信息挖掘出对模型具有高信息量的样本,同时也加入了自步学习来控制不同时期训练数据的难易程度。将利用初始化后模型的输出来评价候选样本与目标模板的空间一致性,用候选区域与时间样本集的最大相似度来评价时间一致性。在几个公开数据集(例如OTB-100,VOT-2015,VOT-2016和UAV123)上进行的实验表明,STAL可以以更少的样本对学习到更加精确的模型。
  对于目标检测任务,对模型性能有影响的不仅是数据规模,还有训练数据的分布特性。由于目标检测任务的训练数据具有原子性,可以方便地统计到数据分布情况。所以本文提出了一种基于数据分布的主动学习策略,并将其与主流的目标检测算法结合。该策略度量已标注样本的特征集合和未标注样本的特征集合在希尔伯特空间的分布来选择最具有代表性的样本,此外还根据熵来评价样本的不确定性。在实际的算法中,利用初始化后的模型对每一个批次的数据利用当前模型提取样本的高层特征,然后依据代表性和不确定性选择样本进行训练。在公开数据集PASCALVOC和COCO上相比于其他的主动学习策略取得了具有竞争力的性能。
其他文献
近年来随着MEMS惯性传感器的出现,使MEMS双轴旋转调制惯导系统成为热门研究内容。本文研究了MEMS双轴旋转调制惯导系统对准及系统算法的设计,并将算法移植到导航计算机中。  首先,对惯性导航系统更新算法进行了深入研究。根据MEMS惯性测量单元输出的角速率和比力信息,提出了基于角速率插值的等效旋转矢量法、基于角速率和比力插值的划桨效应补偿算法两种新的算法,通过仿真验证表明基于角速率插值的等效旋转矢
我国是世界上最大的蔬菜种植国家,蔬菜种植业逐渐成为农民脱贫致富的途径之一。在蔬菜种植过程中病虫害种类繁多,发生规律复杂,广大菜农多依靠主观判断进行病虫害防治,误判率高导致病虫害不能够及时准确的防治,直接影响蔬菜品质和产量,造成巨大的经济损失。随着农业科技的快速发展,要求温室大棚为蔬菜生长提供更加科学的生长环境,根据不同蔬菜不同生长阶段所需养分进行智能施肥。基于以上问题本文研究设计了一种基于图像识别
学位
为了方便寻找遗失的学生“一卡通”,我们构建了一个用于查找和丢失学生校园“一卡通”的平台。该项目需要从用手机相机拍摄的图片中检测文本和图像,提取信息并将其与机构的数据库信息进行匹配。在这种情况下,识别文字和图片将是核心工作。捕获图片后,将对其进行预处理,特征提取以及最终的字符识别。对于此项目,光学字符识别(OCR)用于检测卡上的信息。OCR在各种有限的问题领域中识别效果很好,但是,在设计高精度的OC
互联网和社交媒体的急剧增长促进了复杂网络相关研究的快速发展,近年来一种有效的网络分析方法:网络表示学习受到了广泛的关注,网络表示学习旨在学习节点的低维稠密向量表示,然而传统的网络表示学习方法不能直接应用到符号网络中,目前专门针对符号网络提出的表示学习方法也仅仅考虑了符号网络的结构平衡理论,但是对于在现实世界中广泛存在的有向符号网络而言,Status理论往往比结构平衡理论更加适合。因此本文利用了St
学位
在不可信中继网络中,中继节点被看做是?个具有较低可信度的节点,数据在传输时需要对其保密,而从信息论?度出发的物理层安全则可以有效的做到在保证协作的同时对中继节点保密。本?主要研究了不可信中继?络下的物理层安全,提出了两种不可信中继?络的中继转发策略,其中包括:容错解码转发(decode-and-forward relay networks allowing intra-link errors,DF
在社会心理学研究中,自我报告评估和内隐联想测验分别被用于测量群体的外显态度和内隐态度,但是这两种方法都需要被试人员地主动配合,并且只能进行小规模的群体态度测量。在社会媒体中用户所发表的言论可以反映用户的态度,但是当前的文本态度分析方法并没有对群体的外显态度和内隐态度进行区分。  受到社会心理学态度测量方法的启发,本文旨在研究一种自动化方法用于测量和区分大规模群体的外显态度和内隐态度,而不再局限于小
机器学习的火热发展和计算机科技的进步,使得机器学习算法在计算机视觉领域取得了重大的进步。距离度量学习作为经典的机器学习方法在人脸识别、物体分类、材料分类等众多计算机视觉领域有着广泛的应用。同时,随着信息获取技术的飞速发展,数据的收集能力和表达形式变得越来越多样化。数据的爆炸式增长推动了机器学习算法的进步,大规模精确标注的数据在很大程度上提高了各种机器学习算法和模型的上限,但同时也增加了数据标注的难
随着网络技术的演进与发展,无论是卫星通信系统还是地面网络都面临着资源量有限、用户业务需求量增多、需求种类多样化的问题。如何快速高效地解决调度、分配与部署资源显得尤为重要。良好的调度方案能够最大程度地利用资源来满足用户需求,经济高效地达到目标。  针对资源调度问题,多卫星测控资源调度是目前卫星网络面临的主要问题之一。测控资源调度问题是指测控任务是否能在可见时间窗口内被测控设备所调度,最终实现测控需求
糖尿病是一种由自身缺陷引起的常见的慢性疾病,如果患者没有得到及时的治疗,会引发多种并发症。目前,我国糖尿病防治呈现出“三低”态势,即低知情率、低治疗率和低治愈率。对糖尿病及其相关内容进行深入的研究,有助于提高知情率、治疗率,也有助于相关药物的研发。  随着机器学习的不断完善,智慧医疗已经成为一个研究热点。本文主要对体检数据以及糖尿病蛋白标志物进行研究:在本文的第三章中,使用机器学习对两组体检数据进
网络理论是描述和分析社会、生物、物理、信息和工程科学中的复杂系统的重要工具。但是现有的大多数理论是对复杂网络的单一、静态的描述,不能描述复杂网络多样的交互模式的特性,而多层网络被提出用于刻画复杂网络这一特性。因此,近年来国际上提出的多层网络成为复杂网络领域的重要研究方向之一。但是多层网络的数据规模很大,而对其直接进行分析会造成计算成本过高,效率低下以及不易观察到隐含的模式。最近,网络表征学习被提出
学位