基于随机探测和鲁棒主成分分析的子空间学习方法及其视频处理应用

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:dinghailing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频处理是人工智能中最基本的任务之一,其结果直接影响到后续的图像识别、分类、行为检测等结果。大量的研究表明,高维的视频数据并不是杂乱无章,通过研究我们发现高维的数据都会存在于低维的子空间中。子空间学习是视频分析中一个被广泛使用且十分有效的技术,已被成功应用于视频压缩、目标识别等任务中。本文主要对子空间分割、子空间恢复和子空间压缩在视频处理中存在的四个问题进行研究,具体贡献如下:
  当前广泛使用的基于谱聚类的方法,如稀疏子空间聚类(Sparse Subspace Clustering,SSC)等,时间复杂度为O(n3),也不能很好地解决大规模数据分割问题。为了实现对大规模数据的快速聚类,本文提出了一种名叫随机探测(Random Sample Probing,RANSP)的快速子空间分割方法,其基本思想是通过随机选择种子点,并使用岭回归(Ridge Regression,RR)计算其它点与种子点的相关性,从而快速得到一个子空间的样本。通过使用WoodBury公式优化RR求解过程,RANSP的时间复杂度可达到线性,因此可以对大规模数据集进行快速子空间分割。
  鲁棒主成分分析(Robust Principal Component Analysis,RPCA)的目标在于从污染的数据中获得低秩和稀疏部分,已被广泛地用于计算机视觉中、图像处理等领域中。然而,RPCA还存在可以被改进的地方,比如对核范数和稀疏项的约束。为了提高RPCA模型的子空间恢复能力,我们提出了一种截断加权(Truncated Weighting)的RPCA模型(TWRPCA)。在TWRPCA中,我们保留前10%的奇异值不变,其它的奇异值分别给予不同的权重。最后我们使用非精确增广拉格朗日乘子法(Inexact Augument Lagrangian multiplier,IALM)对TWRPCA模型进行了求解。
  基于RPCA子空间学习的方法及其扩展的模型被成功地应用到运动目标检测中,但是不能较好地处理运动目标缓慢的情况,容易造成“空洞”的现象,尤其是在复杂背景下,如晃动的树叶、波动的湖面等。为了能够在复杂环境中检测运动缓慢的目标,针对动态背景使用了视频分割约束,针对缓慢运动采取了显著性约束,最后本文将视频分割(Segmentation)和显著(Salience)性约束融入到RPCA模型中得到SSC-RPCA模型。与其他文献不同,SSC-RPCA中的显著信息不需要提前计算而是在模型求解过程中得到的。
  自编码器被广泛地使用在图像和视频压缩中,但传统的自编码器需要存储大量的网络参数。而且传统的自编码器需要特定的数据来训练网络,因此其泛化能力较弱。本文提出了一种3阶张量自编码器(3D Tensor Auto Encoder,3DTAE)子空间压缩方法,视频被压缩到非线性子空间中。在传统的基于自编码器的视频压缩方法中,视频被表示为网络参数和向量,而在本文方法中,视频被直接表示为网络参数。假设输入数据的维度是O(n),那么3DTAE网络参数的维度将是O(n1/3),因此可以满足视频压缩的需求。另外,由于视频被直接压缩为网络参数,基于3DTAE的视频压缩方法不存在测试过程,因此也不存在泛化问题。
其他文献
随着社会的不断进步与发展,人类生产生活对于能源的需求日益增长,诸如煤、石油和天然气等不可再生的传统化石能源大量消耗而导致的能源危机及由此触发的环境污染问题日益严重。因此,探索和开发具有低成本和高效率的清洁能源已变得刻不容缓,其中可充电金属空气电池、燃料电池和水分解等电化学储能和转换装置尤其受到科学家及工业界的关注。值得指出的是,氧还原反应(Oxygen reduction reaction (OR
在地球观测应用中,综合孔径微波辐射成像方法利用小口径天线阵列等效合成大口径天线,有效解决了实孔径微波辐射成像方法的口径有限,机械扫描困难等问题。但是综合孔径系统复杂度高,限制了空间分辨率的进一步提高。近年来提出的镜像综合孔径微波辐射成像方法,将反射板与天线阵列相结合,能在不扩大天线阵列尺寸的前提下,获得更高的空间分辨率。  但镜像综合孔径微波辐射成像方法还缺乏有效的实验验证,并且该方法的反射板与天
相变存储器具有读写速度快、循环次数高、可伸缩性良好及多功能应用前景等特性,成为下一代新型非易失性存储器中最具潜力的竞争者之一。目前,相变存储器的研究已取得了很大进展,但依然存在着许多问题,如写“0”操作电流较大,写“1”操作时间较长等。相变存储单元通过施加电脉冲产生热量使相变材料的相态发生变化来进行数据存储,单元内部温度分布是研究其读写性能的关键。本论文考虑热电效应,建立了三维有限元相变存储单元仿
随着雷达系统、科学研究等领域对大功率微波源的需求,多注速调管逐渐由基模多注速调管发展为高次模多注速调管,本文正是在此基础上,对工作于L波段的TM020高次模多注速调管的输出回路进行了研究。首先回顾了速调管的发展历史,介绍了速调管的工作原理、应用领域及发展趋势。重点介绍了多注速调管的发展背景,及多注速调管的工作模式。然后介绍了工作于L波段的TM020模圆柱谐振腔的设计方法,以三维电磁场计算软件ISF
自20世纪70年代光纤出现以来,随着对光纤技术的不断深入研究,人们逐步认识到光纤不但具有良好的传光特性,而且可以用来进行信息的传递,不需要其他中间介质就可以把待测量与光纤中的光特性联系起来。相比于传统的传感技术,光纤传感器用光作为敏感的信息载体,用光纤作为传递信息的媒质,因此它同时具有光纤和光学测量的特点,有着体积小,灵敏度高抗电磁干扰能力强,耐辐射,能量衰减小,集信息传感与传输一体等众多优势。这
随着计算机技术和通信技术的迅速发展以及Internet的不断扩展,嵌入式系统得到越来越广泛的应用.由于嵌入式系统的复杂性不断增加,嵌入式操作系统已经成为嵌入式系统中最重要的组成部分.在各种嵌入式操作系统中,Linux凭借其在结构清晰、源代码开放性等方面的优势,成为了基于监控系统、手持设备等嵌入式系统领域应用中的技术热点.该文主要讨论了如何根据应用需求对Linux操作系统进行修改和剪裁,并将其移植到
该文首先系统的讲述有关智能卡的各种基础知识,如智能卡的种类、内部结构、工作原理.随后结合COS的开发工作重点介绍智能卡片内操作系统COS的各个组成部分:通信接口、文件系统、安全模块以及命令系统.该文详细的分析了T=0接触式通信接口和TypeB非接触式通信接口,同时给出了TypeB防冲撞技术的实现方法.随后,作者介绍了几种可以选择的文件系统,并对各种文件系统的特点进行了比较.针对外界对卡内数据的非法
本论文对传统的指纹识别算法进行了分析、总结,提出了一种新的指纹识别算法.该算法主要包括指纹图像预处理以及指纹特征匹配两大部分,同时对指纹图像的压缩算法也作了详细描述.指纹预处理由图像分割,图像增强,脊线提取及其细化去噪等几个部分组成.指纹特征匹配包括指纹特征提取、特征匹配等.本文指纹预处理过程采用小波增强算法,改善指纹图像质量,利用SPTA算法细化并去除噪声,消去大量的指纹冗于信息,得到较完整的细
深度学习是机器学习领域重要的方法之一,由于其强大的复杂模型构建能力,引起了学术界和工业界的广泛关注。虽然深度学习模型在抽象特征方面具有巨大的优势,但使用浅层神经网络作为分类器制约了深度学习的分类性能。集成学习是机器学习领域中提升模型的可控性和泛化能力的一种通用方法。其中,深度集成是集成方法之一,具有强大的自主学习能力和分类能力,但面对高维复杂问题时表达能力有限。因此,结合深度学习与深度集成各自的优
学位
高光谱图像由于波段多、分辨率高、信息量大等特点,近年来受到国内外学者的高度重视,高光谱图像的降维及分类处理也成为热点问题。传统的高光谱图像处理方法往往只能提取图像的浅层特征,而忽略了图像深层特征,同时该类方法不能兼顾高光谱图像的空间特征和光谱特征,难以得到较佳的分类效果。针对上述问题,本文利用基于深度学习的方法处理高光谱图像。  首先,针对高光谱图像波段冗余度高的问题,使用基于深度子空间聚类的方法
学位