深度学习研究综述

来源 :读书文摘(下半月) | 被引量 : 0次 | 上传用户:LIUCHANGQI2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:鉴于深度学习的重要性,本文对深度学习研究情况进行了综述。首先介绍了深度学习的概念及深度学习的发展历程;然后总结了深度学习算法在不同数据处理中的最新应用现状及其发展趋势。可以看到:深度学习在不同应用领域都取得了明显的优势,但仍存在需要进一步探索的问题,如无标记数据的特征学习、网络模型规模与训练速度精度之间的权衡、与其他方法的融合等。
  关键词:深度学习;研究综述;应用
  一、深度学习的概念
  2006年,深度學习的概念初次被G.E.Hinton等提出,指基于样本数据通过一定的训练方法得到包含多个层级的深度网络结构的机器学习过程,Hinton认为,应该先用无监督预训练方法去完善网络权值的初值,之后再进行权值微调,拉开了深度学习的序幕。
  二、深度学习发展历程
  深度学习最初起源于人工神经网络的研究,旨在通过建立一个多层的网络结构,深度挖掘数据的本质信息(梁军,2015)。之前优化算法和计算速度的限制,使得神经网络研究基本停滞于单个隐层的结构。2006年,多伦多大学的神经网络专家Geoffrey Hinton在“Science”杂志上发表文章“Reducing the dimensionality of data with neural networks”,从此拉开了深度学习研究和应用的序幕。
  随着深度学习的广泛应用和热度的提高,很多新的算法被提出。如2010年提出的半监督学习算法,(即判别深度置信网DDBNs),被成功地应用于进行可视化数据分类。之后学者们又提出一种新的深度学习算法(深凸网络Deep Convex Network,DCN),用于语音识别中可扩展的挑战。2013年国内学者又开发了一种半监督学习算法,称为卷积深度网络(Convolutional Deep Networks,CDN)用于深度学习中图像的分类问题。
  接下来,我们在深度学习中面临的挑战是破译一个个体的思维和想法,要想完成这种理解能力,首先需要构建可以理解人们感情的算法,然后建立能理解多维度情感的算法。为解决自然领域的情感分析问题,许多新的算法相继被提出,最近,斯担福大学的研究生Richard Socher和Andrew Ng(Google深度学习项目工程师之一)等人共同研究开发了一个深度学习的新算法,即Neural Analysis of Sentiment(NaSent),目的是理解字里行间流露的感情。目前,应用最广的情绪分析是:词袋(bag of words)模型,词袋中的词汇分为正面和负面两个维度,通过计数来判别出整个段落的含义是正面还是负面。
  三、深度学习的應用
  从2006年至今,深度学习在图像、语音和自然语言处理等各个领域都有很好的研究,使得很多技术任务有了突破性进展。
  1.语音识别。微软研究人员提出了隐马尔可夫混合模型(CD-DNN-HMM),该网络是第一个成功应用于大词汇量语音识别系统的深层神经网络,随后又通过在含有300h语音训练数据的Switchboard标准数据集上,对CD-DNN-HMM模型进行了评测。(尹宝才等,2015)。H.Zen等以由一名女性专业演讲者以美国英语录制的3.3万段语音素材为训练数据,提出一种基于多层感知机的语音合成模型。K.Cho等提出一种基于循环神经网络(recurrent neural network,RNN)的向量化定长表示模型(RNNenc模型),应用于机器翻译。
  在语音识别任务上,深度学习完全超越了传统的最好算法,大幅度提高了语音识别的准确率。一些拥有语音识别业务的公司,如百度、Google、微软等,也都使用深度学习技术来改善自己的语音识别系统。最近,深度学习在自然语言处理的研究中也同样火热。比较有代表性的工作和成功应用有主题模型、词向量、情感分析、机器翻译等。除此之外,深度学习还在电影推荐、运动识别、音乐检索等任务上发挥着重要的作用。
  2.计算机视觉。深度学习在计算机视觉上的成功应用,主要体现在对象识别和人脸识别领域上。2010 年人们引入大数据集,例如ImageNet数据集中有着15百万的标记高分辨率图像和超过2万2千个类别。A.Krizhevsky 等在2012年通过训练一个大的深度神经网络来对ImageNet LSVRC-2010中包含着1000个不同类别的1.2百万个高分辨率图像进行分类,刷新了这个数据集的最好记录。2014年Sun等提出了深度隐藏身份特征(deep hidden identity feature,DeepID) 的方法去学习高等级特征表征来进行人脸识别。
  3.自然语言处理。自然语言处理( natural language processing,NLP)意在将人类语言转换到能够容易地被计算机操作的表征的过程。2008年R.Collobert等通过将一个普通的深度神经网络结构用于NLP,在“学习一个语言模式”和“对语义角色标签”任务上通过将重点关注到语义角色标签的问题上进行了没有人工设计特征参与的训练,其错误率为14.3%的结果刷新了最好记录。
  4.信息检索。信息检索(information retrieval,IR)就是用户输入一个查询到一个包含着许多文档的计算机系统,并从中取得与用户要求所需最接近的文档。深度学习在IR的应用主要是通过提取有用的语义特征来进行子序列文档排序, 2014年Shen Yelong等提出了卷积版的深度结构语义模型(convolutional deep-structured semantic modeling,C-DSSM),C-DSSM能将上下文中语义相似的单词通过一个卷积结构投影到上下文特征空间向量上,从之前43.1%的准确率提高到了44.7%。
  不同于以往浅层结构只能解决许多简单的或者许多约束条件下的问题,深度结构能够处理许多复杂的真实世界中的问题,例如人类语音、自然声音和语言、自然图像、可视场景等问题,它们可以直接从数据中提取数据所包含的特征而不受具体模型的约束,从而更具有泛化能力。
  四、深度学习研究展望
  深度学习算法在计算机视觉(图像识别、视频识别等) 和语音识别中的应用,尤其是大规模数据集下的应用取得突破性的进展,但仍有以下问题值得进一步研究:
  1.无标记数据的特征学习。现实世界存在有海量的无标记数据,将这些无标记数据逐一添加人工标签,是不现实的。所以,随着数据集和存储技术的发展,无标记数据的特征学习将越来越重要。
  2.模型规模与训练速度、训练精度之间的权衡。一般我们认为,相同数据集下,模型规模越大,训练精度越大,训练速度会越慢。故而,如何在保证一定的训练精度的前提下,使训练速度提高,将是深度学习方向研究的课题之一。
  3.与其他方法的融合。从上述应用实例中可发现,单一的深度学习方法,往往并不能带来最好的效果,要想提高精确度,需要融合多种方法进行平均打分。因此,有必要将深度学习方法与其他方法进行融合。
  参考文献:
  [1]尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,(1):48-59.
  [2]梁军等.基于深度学习的微博情感分析[J].中文信息学报, 2015,28(5):155-160.
  作者简介:
  马瑜璠(1989—),女,汉族,山西运城,硕士研究生,山西财经大学会计学院,审计理论与实务。
其他文献
摘 要:当前社会主义市场经济表现出了社会经济体制和社会生活方式多样化的态势,作为新形势下的企业面临着生存和发展的巨大压力,思想政治工作显得繁重而紧迫,在新形式下,如何通过企业政工工作来凝聚广大职工的向心力、凝聚力,已成为现阶段国有企业政工工作者必须思考和研究的问题。本文结合工作实际就新形势下国有企业政工工作谈几点认识。  关键词:新形势;国企;思想政治工作  一、新形势下思想政治工作的重要性  1
摘 要:本文的研究、调查和论文的完成采用了文献资料法,问卷调查法,专家访问法,数理统计法,对比法等,通过对武汉市某高校学生为例,分别选取实验组和对照组,在运动会前、中、后期利用问卷调查法,汇总统计本班同学相互间的熟悉度,友好度,团结协助能力等,进一步研究出普通高校运动会的开展对提升班级团体凝聚力的重要意义,为指导今后如何通过运动会的项目类别的不同,参与人数成员的不同对班级凝聚力的影响,更有效率提高
摘 要:随着科技发展,信息载体由纸质向电子材料转变,这将导致办公模式随之改变,企业档案部门的功能也将发生变化。企业档案部门将由档案管理向综合信息部门发展。文件生命周期理论解释了信息的活动规律,而电子产品为信息内容的发展提供了介质,从而使得企业档案部门向综合信息服务部门转变。构建企业信息平台愈加重要,本文式析企业信息平台构建的具体设想。  关键词:档案资源;企业信息平台;信息化;数字化  大数据时代
摘 要:在经济新常态、经济下行压力不断加大和供给侧改革的多重压力,煤炭企业面临着严峻的挑战,经受着巨大的考验。在此情况下,做好工会扶贫帮困工作,对于凝聚人心,共渡难关具有重要意义。本文介绍了做好工会扶贫帮困工作的要点,分析了当前工会组织扶贫帮困工作需破解的几个难题,并对做好工会扶贫帮困工作提出了建议。  关键词:工会;扶贫帮困;思考  当前,煤炭行业面临前所未有的困难和挑战,困难职工扶贫帮困工作矛
摘 要:随着时代的发展,技术的革新,当前我们的教学方式以及方法都得到了一定的完善。在大学计算机教学过程中翻转课堂的教學模式也已经逐渐被诸多教师所重视,并且也获得了良好的教学效果,基于此,本文分析了大学计算机基础“多模”翻转课堂。  关键词:大学计算机;“多模”;翻转课堂  对于传统的教学模式来说翻转课堂教学模式具有一定的颠覆性,给学生有了更多自主学习以及思考的空间。相对于传统教学而言,翻转教学模式
摘 要:成语是中国汉字语言词汇中一部分定型的词组或短语。成语在我国传统文化中占有重要地位,是我国源远流长,博大精深文化的体现。在现阶段,科学技术和信息传递方式的重大改变,使得成语或其他传统文化的传承受到影响,作为传承文化的主体,广大青少年学生对成语的自主学习意识逐渐降低,缺少对传统文化传承的历史责任感,这种情况使得成语教学肩负着重要的使命。那么如何对高中语文的成语教学进行改革,才能较好达到既能充实
摘 要:彝文典籍《勒俄特依》是一部宏伟的文化遗产,主要流传于彝语北部方言区。在彝族民间以活态的口头文本与稳定的书面文本双重形式传承与传播。其富含丰富的民族历史文化内涵,对彝族社会发展具有重要的作用。分析史诗的文本版本类型,对深入解读彝文典籍具有重要的现实意义。从版本学视角,分析彝文典籍《勒俄特依》的口头演述版本、书面文献版本、外文文献版本等。  关键词:勒俄特依;口传版本;书面版本;外文文献  一
摘 要:国学教育的主要目的是希望通过对学生传授中国传统思想文化,达到培养学生文化传承意识和民族意识的目的。国学教育曾一度在我国的教育史上发光发热,培养了一批又一批的文化先驱,当由于我国之前的闭关锁国的政策,使得其在教育历史上一度衰落。但在现代的知识时代,由于一些近代思想教育家对其进行深入研究,使人们重新认识了其价值,对于中国传统思想产生了新的认同,国学教育在教育的舞台上又重绽光彩。本文首先研究了国
摘 要:临床护理学的一个重要分支性内容即五官科护理学,五官科护理学主要包含了口腔科、咽喉科、鼻科、眼科和耳科的护理知识,由于五官科护理学涉及的知识范围较广,相关内容具有整体性强的热点,因而在教学实践中课程任务量较大。五官科护理学知识丰富,知识体系抽象且繁多,学生在学习过程中压力大、记忆和理解难度也较大,可综合应用情境教学法,简化学生的学习程序,提高学生的学习动力。本篇文章在此基础上,主要对情境教学
[摘 要:小学数学是小学阶段课程的重要组成部分,有利于培养小学的逻辑思维能力、创造能力以及动手能力。机械死板的课堂理论教学并不能够满足小学生日益增长的求知欲望,因此,小学数学的学习应该与实际相结合,融入到我们的日常生活中去,让数学与生活同行。教师应该结合相关的生活案例教学,以此来激发小学生的学习兴趣,避免教学时的空洞无味。本文主要从小学的教学现状出发,结合苏教版小数教材,对小学数学的生活化教学进行