张量分析及其在图像和视频处理中的应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:lionfirst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信号处理和数据分析中,张量作为向量、矩阵等概念在组织结构上由低维向高维扩展所得到的一般形式,可以自然地表示高维数据,从而刻画现实中复杂的事物.以张量为视角的数据处理方法能够保持数据蕴含的结构信息,这个优势使得张量方法在高维数据处理中极具潜力.近年来,张量方法的研究和应用已经扩展到心理测量、医学成像、信号处理等多个领域.本文整理和分析了现有的张量方法所取得的进展,并在此基础上提出了一系列使用张量方法处理高维数据的研究结果.  图像、视频以及从中衍生的数据,都蕴含了大量的高维结构.传统的数据分析方法需要首先将这些数据展开成向量或矩阵的形式,再使用如主成份分析等矩阵方法降维和进一步处理.这样的处理方法往往会破坏数据的内在结构,从而不能达到理想的效果.为此,本文从特征值和分解两个主要方向来讨论张量分析的方法.首先,张量特征值是矩阵特征值向高阶的扩展,它可以用来刻画高维数据的特定性质.如何合理定义张量的特征值并揭示特征值和特征向量的内在含义是具有挑战性的问题.本文将张量特征值应用到图像光照检测和动态纹理分析中.另一方面,张量分解是矩阵奇异值分解的高阶扩展,可以探索高维数据的构成,是分析高维数据的有力工具.本文将张量分解应用到纹理视频压缩和动态背景建模中.  总结本文研究的张量分析的理论及其在图像和视频处理中的应用,主要取得如下成果.  1.对高阶张量定义一种新的特征值-D-特征值.这个定义适用于任意阶张量,涵盖了在之前特征值研究中较少涉及的奇数阶张量的情形,并给出了包括特征多项式在内的相关性质.这种特征值在保持高维数据内在结构的基础上,可以根据应用需求选取相应的辅助张量,在理论上提供了数据分析的一个新的工具,也在多个图像和视频应用中取得了很好的效果.  2.提出一种使用D-特征值刻画图像光照的方法.这个方法首先从图像的梯度统计中提取梯度偏度张量,根据D-特征值的性质,图像局部区域的光照方向可通过计算相应梯度偏度张量的最大D-特征值来确定.实验表明这个方法对图像光照的估算准确稳定,在实际应用中可以用来检测一类原始的图像造假,比如知名的“周老虎”事件.  3.提出一种使用D-特征向量刻画视频动态纹理的方法,并提出相应的分类算法.最大D-特征值所对应的D-特征向量不仅蕴含了光照信息,而且可以刻画纹理视频的动态性质.实验表明这个方法不仅可以实现多种纹理的模糊分类,而且可以进一步分析纹理的动态性质.  4.提出张量的紧凑表示的概念,是张量低秩近似的一个新的优化目标.在针对纹理视频的压缩实验中,峰值信噪比可以在同码率的条件下较H.264/AVC提高2 dB到9 dB.  5.提出一种使用张量低秩近似的视频动态背景建模的方法.这个方法可以处理具有复杂场景的背景建模问题,并有效地分离动态场景下的前景和背景.
其他文献
经典线性模型的普遍化——广义线性模型,成功地处理了因变量与自变量之间复杂的非线性关系,克服了经典线性模型的局限性。数据缺失现象不可避免的存在于各个领域,丢掉缺失的数据
沈敏康1926年生。中共党员。第六、七届全国人大代表,市八届、九届人大代表,常委会秘书长。曾任中共上海市委办公厅主任。1949年上海刚解放,当时沈 Shen Min Kang born in 1
Cutoff现象描述的是一些马氏链在收敛到平稳状态过程中呈现出急剧的转变的现象.已有研究表明cutoff现象的产生与谱隙和混合时有关,本硕士论文得到连续时间生灭过程separation
光纤通信以其独特的优越性成为当今信息传输的主要手段,因此光纤障碍定位及其维护的问题显得尤为重要。OTDR(光时域反射仪)是目前监测光纤障碍最为有效的工具,它是根据瑞利散射
近些年,在生物数学模型中,以生态种群动力系统为基础的研究已经得到了充分的发展,其中动力系统主要分为连续微分系统和脉冲微分系统。连续微分系统一直是上世纪的研究方向,当人们
本文研究了Banach空间中一类集值映射的度量次正则性,给出并且证明了parametric constraint系统度量次正则性的充分条件,然后将其应用到数学规划中,得到了不等式约束问题误差界
本文关注带测量误差的变系数部分线性模型的变量选择问题.随着科学技术的发展,人类能够得到的数据越来越多,然而当我们要考虑这些因素对某一个变量的影响时,就需要从众多的数
为了研究相互关联的几类数据序列,提出了多元马可夫链模型。已知一个多元马可夫链模型,关键的问题是研究它的联合稳定分布。这篇文章主要通过两种方法,对含有s条链的多元马可夫
复值神经网络(CVNNs)近年来已经得到了广泛的关注和研究,例如在认知科学、智能领域以及雷达信号处理方面有着巨大的潜在价值。复值神经网络特点是输入、输出以及权值均为复数。
本文我们主要研究了一维情况下两类含双曲退化的非线性守恒律方程组的Riemann问题。  前两章我们首先陈述了所研究问题的背景和结果,介绍了一维守恒律方程组的一些基本概念