论文部分内容阅读
在信号处理和数据分析中,张量作为向量、矩阵等概念在组织结构上由低维向高维扩展所得到的一般形式,可以自然地表示高维数据,从而刻画现实中复杂的事物.以张量为视角的数据处理方法能够保持数据蕴含的结构信息,这个优势使得张量方法在高维数据处理中极具潜力.近年来,张量方法的研究和应用已经扩展到心理测量、医学成像、信号处理等多个领域.本文整理和分析了现有的张量方法所取得的进展,并在此基础上提出了一系列使用张量方法处理高维数据的研究结果. 图像、视频以及从中衍生的数据,都蕴含了大量的高维结构.传统的数据分析方法需要首先将这些数据展开成向量或矩阵的形式,再使用如主成份分析等矩阵方法降维和进一步处理.这样的处理方法往往会破坏数据的内在结构,从而不能达到理想的效果.为此,本文从特征值和分解两个主要方向来讨论张量分析的方法.首先,张量特征值是矩阵特征值向高阶的扩展,它可以用来刻画高维数据的特定性质.如何合理定义张量的特征值并揭示特征值和特征向量的内在含义是具有挑战性的问题.本文将张量特征值应用到图像光照检测和动态纹理分析中.另一方面,张量分解是矩阵奇异值分解的高阶扩展,可以探索高维数据的构成,是分析高维数据的有力工具.本文将张量分解应用到纹理视频压缩和动态背景建模中. 总结本文研究的张量分析的理论及其在图像和视频处理中的应用,主要取得如下成果. 1.对高阶张量定义一种新的特征值-D-特征值.这个定义适用于任意阶张量,涵盖了在之前特征值研究中较少涉及的奇数阶张量的情形,并给出了包括特征多项式在内的相关性质.这种特征值在保持高维数据内在结构的基础上,可以根据应用需求选取相应的辅助张量,在理论上提供了数据分析的一个新的工具,也在多个图像和视频应用中取得了很好的效果. 2.提出一种使用D-特征值刻画图像光照的方法.这个方法首先从图像的梯度统计中提取梯度偏度张量,根据D-特征值的性质,图像局部区域的光照方向可通过计算相应梯度偏度张量的最大D-特征值来确定.实验表明这个方法对图像光照的估算准确稳定,在实际应用中可以用来检测一类原始的图像造假,比如知名的“周老虎”事件. 3.提出一种使用D-特征向量刻画视频动态纹理的方法,并提出相应的分类算法.最大D-特征值所对应的D-特征向量不仅蕴含了光照信息,而且可以刻画纹理视频的动态性质.实验表明这个方法不仅可以实现多种纹理的模糊分类,而且可以进一步分析纹理的动态性质. 4.提出张量的紧凑表示的概念,是张量低秩近似的一个新的优化目标.在针对纹理视频的压缩实验中,峰值信噪比可以在同码率的条件下较H.264/AVC提高2 dB到9 dB. 5.提出一种使用张量低秩近似的视频动态背景建模的方法.这个方法可以处理具有复杂场景的背景建模问题,并有效地分离动态场景下的前景和背景.