基于深度学习的图像特征学习和分类方法的研究及应用

被引量 : 0次 | 上传用户:quiet11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是计算机视觉领域热门研究方向之一,也是其他图像应用领域的基础。图像分类系统通常分为底层特征提取、图像表达、分类器这三个重要组成部分。其中,特征往往是决定整个系统优劣的重要部分,良好的特征能够准确地提取出有利于解决问题的信息。要设计一个有效的特征往往需要相应领域的先验信息,因此研究者们提出了各种针对自身领域的特征。但是如果采用这些底层特征直接进行像大规模图像分类,常常会达不到很好的效果。另外,底层特征需要耗费大量时间设计和调优,这使得底层特征的发展比较缓慢。底层特征难以设计和调优的瓶颈使得图像分类领域难以更进一步。因此研究者们从设计特征转而研究学习特征,希望能够从图像中自动地学习出有效的特征。研究发现利用深度卷积网络能够从海量的图像中自主地学习出底层到高层的特征,并使得图像分类任务接近人类的水平。因此,特征学习成为了图像分类领域的重点方向,且具有广泛的应用价值。针对图像分类中特征学习的问题,本文沿着将单层特征学习扩展到多层特征学习,并将深层特征学习方法应用到实际问题这一路线,对特征学习进行了研究,主要研究内容和创新点如下:1.研究了单层特征学习方法和多层特征学习与分类方法,将受限玻尔兹曼机、自动编码机、稀疏编码和子空间学习都作为单层特征学习方法进行研究。通过研究多层特征学习与分类方法,我们可以将有监督的单层特征学习方法应用到卷积网络中。2.本文提出了基于流形学习的逐层鉴别式特征学习方法——DLANet。该特征学习方法采用了卷积网络结构,将鉴别式局部配准(Discriminative Locality Alignment,DLA)用于学习卷积结构中的滤波器组,使得特征在降维后的子空间中有更好的鉴别性。我们将DLANet特征作为底层特征用于LLC-SPM图像分类框架中,并应用到场景分类任务上。我们在NYU Depth V1、Scene-15和MIT Indoor-67三个场景分类数据集上进行了实验,实验结果表明可学习的DLANet特征优于其他手工特征,同时也优于同类的PCANet特征和LDANet特征。本文提出的场景分类系统与其他方法相比也是可比的。3.本文提出了一个新的训练深度神经网络准则,最大间隔最小分类误差(Max-margin Minimum Classification Error,M3CE)。不同于Softmax和交叉熵准则,最小分类误差(Minimum Classification Error,MCE)准则希望提升标注对应的后验概率并降低混淆类别的后验概率。为了能够更好地训练深度网络,防止梯度弥散,我们改进了MCE中的损失函数提出了M3CE。我们在MNIST和CIFAR-10数据集上进行实验,实验表明M3CE作为交叉熵的有效补充能够取得较好的结果。4.本文将深度卷积网络应用到文本行语言分类和手写印刷体分类问题。为了更好地训练卷积神经网络以适应文本行数据库,本文提出了文本行输入方式,该技术能够同时处理三个尺度的文本行。通过这个技术,卷积网络能够在训练时覆盖更多的文本内容从而学习到更具鉴别性的特征。本文提出文本行图片自重现机制(Self-Reappeared Padding Scheme,SRPS)来解决样本不足的问题。另外,为了同时解决解决语言分类和手写印刷体分类两个问题,本文提出了两阶段多任务学习框架来学习得到鲁棒的共享特征。最后,本文在3种卷积神经网络结构上试验并分析本文提出的方法。实验结果表明文本行输入方式能够明显地提升识别率,而两阶段多任务学习得到的卷积神经网络分别在语言分类和手写印刷体分类问题上获得高于95%和99%的准确率。
其他文献
反邪教协会具有许多其他社会团体尚不具备的特殊职能,具有不可替代的独特优势。近年来,长沙市反邪教协会利用自身优势,采取多种举措集中转化邪教刑释解教人员,收到了良好的效
文章分析了高校图书馆读者"占座"现象形成的主客观原因,阐述了读者"占座"现象所产生的消极影响,并结合本馆实行"座位管理系统"的实际情况,给出了解决图书馆读者"占座"问题的
文学的雅俗问题是文学研究中的一个重要对象。相关的研究往往因为忽略了雅与俗之间相对性的基本特征而使问题变得扑朔迷离、千头万绪。雅与俗自产生之初就存在着相对性的特点
<正>1重症肌无力眼肌型孙某,女,60岁,2003年12月8日就诊。因左上眼睑下垂半年,复视20d,曾就诊于山东省立医院,确诊为重症肌无力眼肌型,给予溴吡斯的明30mg,1日2次,因服后腹痛
<正>据《新京报》报道,2012年4月起,温州推行公务车辆改革。拍卖公车1400辆,约占总数80%;留下300辆左右执法执勤公车。车改后的用车补贴,从正县实职到科员、办事员按职务层级
为了改善低纬高原地区天气预报水平,利用WRF(Weather Research and Forecasting)模式及其变分同化系统进行雷达VAD(Velocity Azimuth Display)反演风场资料同化试验。通过设计不
目的探讨产前综合干预模式对初产妇分娩应对能力的效果及其可能对分娩结局产生的影响。方法将2012年1月~2014年2月入选的417例初产妇采用随机数字表法分为干预组214例与对照
目的:探讨系统性自我管理教育对社区2型糖尿病患者生命质量及焦虑抑郁情绪的影响。方法:2009年2月~2010年7月随机选取长沙市10个社区,干预组与对照组各5个,共纳入2型糖尿病患
“四书”对中国传统文化的影响久远而深沉,对统一的中华民族的民族意识和民族心理的形成意义重大,是中国传统文化中最为著名的经典体系之一。然而,此四著作在何时连缀而被纳入一
<正>冀教版小学数学新教材的编排有利于学生的发展,有利于调动学生学习的积极性,真正给学生一个自由的空间,让他们充分地展开讨论,发表自己的意见,参与到数学学习中去,让学生