基于深度学习的图像增量学习研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户：tlswedu

【摘要】

：

随着计算机视觉领域向人工智能的方向发展,人们需要更灵活的策略来应对现实世界中物体分类的大规模性和动态性。至少,当新类别的训练数据被引入时,分类网络应该能够增量式地

【作者】

：

缪永彪

【出处】

：

浙江工业大学

【发表日期】

：

2020年01期

【关键词】

：

图像分类深度学习增量学习卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机视觉领域向人工智能的方向发展,人们需要更灵活的策略来应对现实世界中物体分类的大规模性和动态性。至少,当新类别的训练数据被引入时,分类网络应该能够增量式地学习新类别的特征,而不是重新学习所有数据。增量式学习的模式可以为人工神经网络的训练节省下许多训练时间,并且保证了模型的精度。增量学习满足了这一现状,通过对大数据分阶段的训练学习,在节省大量训练时间成本的同时,又满足了分类器对精度的高要求。然而,增量学习存在灾难性遗忘问题,并且目前学术界的增量学习算法普遍具有过分依赖系统内存,网络架构巨大等问题的限制。在此背景下,本文开始研究基于深度学习模型的动态修正向量的增量学习算法。论文的主要内容如下:(1)基于深度神经网络的增量模型研究。模型的主干网络采用公认有效的深度神经网络Alex Net和Res Net,确保对于各个数据集有强大的识别能力。基于深度神经网络的增量技术主要包括以下几步:首先,本文提出储存旧类别数据的内存作为代表性记忆,在后续增量阶段中和新类别数据联合训练的方法,保证新旧类别的识别能力。其次,系统的内存和计算资源保持有界。为了指定系统的内存上界,提出了一个超参数K,称为分类器的内存预算。最后,在增量过程中,本文使用新数据和代表性记忆中的范例来计算分类和蒸馏损失函数。(2)基于动态修正向量的增量学习算法研究。代表性记忆和知识蒸馏这两个技巧会产生新的问题,称之为偏置问题和过拟合问题。对于现有的类别,知识蒸馏会使教师模型中存在明显的噪声,会对学生模型产生误导。而由代表性记忆产生的不平衡的训练集可能导致模型的不准确的特征表示。本文提出的修正向量表示训练中概率标签和真实标签的统计量。分类结果通常偏向于参与训练的数据较多的类别。因此,修正向量直观地反映了模型偏向于每个类的程度。因为每个增量阶段中数据是动态变化的,本文提出动态的修正向量以适用于增量学习领域。(3)针对提出的增量模型进行评估与分析。深度神经网络Alex Net和Res Net在图像和信号数据集上进行多阶段的增量训练,评估本文提出的增量算法与当前学界中最优秀的三个增量算法进行对比实验,从最终精度,平均精度,混淆矩阵和增量训练耗时等多个方面进行评估算法性能。从而证明本文提出的增量模型在各个数据集上都有泛化性,并且保持着最高的精度和最短的训练耗时。(4)基于固定特征的信号增量学习应用。由于信号数据通常是不可视的,通常需要专业人员才能将其区分,从而产生了大量的人工成本。所以在信号大数据的背景下,对信号大数据进行增量式识别是非常必要的。而通过固定特征的方法,建立了信号数据的特征库,节约了专业人员的时间成本,提高了工作效率,直接利用数据的特征进行对比数据。

其他文献

基于CNN的中文文本摘要自动生成方法研究

技术是指通过算法对文本信息高度概括后生成更加精炼、语义通顺的摘要,目的是为了在文本类数据中快速的筛选信息,解决信息冗余过载的问题。当前文本摘要的研究大多集中在传统

学位

Seq2seq-attention生成式文本摘要系统CNNLSTM

基于3G无线网络的图像传输系统设计与实现

当今社会,随着网络技术的不断发展,网络传输能力也不断增强,移动互联网呈现井喷式的发展,基于移动互联网传输音视频数据的应用更是得到了前所未有的发展。其中,特别是利用3G

学位

无线网络图像传输3G

基于RNN的质量预测模型研究及在烧结矿中的应用

循环神经网络（Recurrent Neural Networks,RNN）相比于传统的神经网络预测模型,预测速度快、准确度高,但其得到的初始权值和阈值还没有达到最优。因此,文章对RNN进行改进,重点研

学位

RNN遗传算法GA-RNN烧结矿质量预测模型

烟草PRE1基因的克隆和功能分析

烟草是茄科烟草属植物,具有极高的药用价值和经济价值,烟草产业也为我国财政收入做出了巨大贡献。烟草的产量和品质直接影响了其价值。烟草生长至一定阶段,就会由营养生长转变为生殖生长,此时烟草体内大部分的营养物质就会被运输至顶端,叶片、茎、根系生长滞后,而烟草的主要利用价值在于叶片,为了使烟草在栽培中一直进行营养生长,多年来人们探索出来的最有效的也是运用最广泛的方法是打顶,原理是在烟草长出花序后的一段时间

学位

烟草NtPRE1打顶根系生长发育

基于BLE和VLC的室内融合定位

基于位置服务(Location Based Service,LBS)是物联网发展的热点之一。现实生活中,地理位置是人行为活动的重要基础,并且人的活动约有80%时间是在室内进行的。因此,只要能够成

学位

低功耗蓝牙可见光室内定位融合定位

基于实体零售场景的密集目标检测

随着通用目标检测技术的不断发展,对规范图片的目标检测能力已经大幅提升,然而在很多人为的特定场景中,目标往往是不规律且难以检测的。而这些场景往往更具有工程应用意义,例

学位

实体零售目标检测注意力计算机视觉

电子商务支付模块的研究与设计

随着互联网技术的普及和手机等移动终端设备的智能化,越来越多的传统业务开始向线上电子商务模式发展。从早年传统的B2B、B2C,到当下流行的O2O,都强烈地吸引着企业经营者们的

学位

在线支付电子商务网络安全系统设计

论破产受偿制度

本文首先明确了破产受偿制度的概念,并阐明其特征与价值;其次,通过对典型案例的分析,总结出我国破产受偿制度在实践中遇到的主要问题,即债权地位设置不合理、受偿顺序规定有冲突、受偿范围界定不明确等。针对实践中的主要问题,本文从我国破产受偿制度的立法现状以及理论辨析的角度对诸问题产生的原因进行了分析,并针对性的提出了完善建议:其一,应当通过建立债权优先级和担保债权的结算规则去平衡破产清算程序中各主体间的利

学位

破产受偿制度优先受偿

武汉城市广场视觉信息媒体生态设计管理研究

城市广场是市民活动的载体和精神文明的窗口。城市广场视觉信息媒体属于广场重要的窗口设施,是以一定的媒体介质载体形态来表现文字、图像与信息符号等视觉信息要素。应用生

学位

城市广场视觉信息媒体生态设计艺术管理

北祁连川刺沟A型花岗岩的年代学及其意义

关于北祁连南蛇绿岩带蛇绿岩,前人多认为是形成于洋中脊环境的早古生代大洋岩石圈残片。本次对川刺沟A型花岗岩和其周围超基性岩的研究,有助于较全面认识该区时代序列与构造格架。川刺沟A型花岗岩的组成矿物为碱性长石(45 vol.%)、石英(30 vol.%)、斜长石(15 vol.%)以及少量的霓辉石(5vol.%)等,发育条纹、显微文象和蠕虫等结构。岩石具有高SiO_2(72.5873.96wt%)和高

学位

北祁连早古生代A型花岗岩SHRIMP锆石测年活动大陆边缘

基于深度学习的图像增量学习研究

其他学术论文