深度学习新模型及其应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bittercoffee456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年大数据的兴起和高性能计算的普及,缓解了传统深度神经网络易过拟合和计算复杂度高等缺陷。由此,深度神经网络强大的数据表示能力得以被释放,并逐渐发展成为一个独立的领域,即深度学习。深度学习的兴起直接推动了人工智能、计算机视觉、模式识别、自然语音处理、语音处理以及机器人等多个领域的飞速发展,并获得政产学研各方面人士的广泛关注。本文围绕深度学习开展了一系列创新研究,针对现有模型结构设计方面的不足,提出了多种新型模型能够更有效地用于计算机视觉与模式识别等领域的多个任务。本论文的具体工作概括如下:  通过将多标签预测问题转换为多任务学习问题,提出了多任务条件玻尔兹曼机模型来进行无约束的多模态学习,能够在一个统一框架下同时解决多模态数据中所出现的部分模态数据缺失、多源数据融合和类别共生关系建模等问题;  通过在传统高阶玻尔兹曼机的基础上引入监督信息,提出了深度条件高阶玻尔兹曼机模型及其相应的判别式学习算法,该模型能够精确度量数据之间相似性关系,进而适用于处理一些对判别性要求较高的关系学习任务,包括人脸验证和行为关系分类等;  通过将所有的全连接操作替换为卷积操作,提出一种全卷积的循环神经网络,可以将模型的参数由百万级降低至几万的同时还能够保持视觉内容的空间结构信息。该模型在视频超分辨应用上相对于其它同类方法在取得高精度的同时还可以在测试速度方面提升两个数量级;  提出了一种基于选择式多模态循环网络的匹配方法,可以选择性关注成对图像文本中的所包含的语义实例,并动态地融合多个局部相似性以最终得到全局相似性。该模型探究了基于上下文信息的视觉注意机制建模,在跨模态检索任务上取得很好结果。
其他文献
打乒乓球对机器人来说是一项综合性挑战,尤其针对接打旋转球,对机器人的视觉系统、决策系统以及高速运动控制系统都提出了更高的要求。本文在已有机器人击打推挡球的基础上,重点
支持向量机(SVM)一直都是机器学习领域里的热点研究课题,在产业界也得到了广泛的应用。它建立在统计学习的VC维理论和结构风险最小理论的基础之上,泛化能力好,在很多任务中表现
针对定义在偏置换矩阵上的组合优化问题,本文提出了基于高斯平滑的渐非凸渐凹化算法,并将其应用于图匹配等组合优化问题。定义在偏置换矩阵上的组合优化问题是计算机科学领域的
作为3G增强技术之一的多用户检测由于能很好的减少多址干扰和解决远近效应问题,显著提高系统容量等方面的优越性,使得它在众多新技术中备受关注。众所周知,随着经济水平的发
HART智能设备以其兼容(4~20)mA模拟信号且具备数字通信功能的优势获得广泛地应用。数字通信的功能使其能够实现在线的监测、诊断、校验等。构建HART数字通信网络,实现HART设备
随着移动机器人应用范围的日益扩展,在动态、非结构环境下提高自主导航行为能力已经成为移动机器人研究领域的首要问题。本文以“863”高技术计划资助项目“模块化机器人体系
学位
随着计算技术的不断发展及互联网应用的日益普及,各行各业产生了大量信息数据,如何有效利用和挖掘过往数据,学术界和工业界开展了大量的探索与尝试。基于电商历史交易数据可以辅
海底热流数据是开展海洋油气资源综合评价的一个重要参数。利用测量的海底热流数据,结合盆地演化认识和数值手段,可以获得各烃源层所经历的温度史,借助有机质成熟模型,有望揭
月球是离地球最近的天体,探索月球是人类认识太空的第一步。相比地球,月球环境非常恶劣,人类无法长时间在月球上进行各种考察活动,将月球探测车送上月球,通过其采集月表的岩
学位
在人机交互、智能监控、视频检索等领域,人体行为识别具有很大的应用价值。它已吸引了众多研究者专注于这个方向的研究。近年来,基于RGB视频的人体行为识别的研究取得了很大进