论文部分内容阅读
特征提取是状态监测和故障诊断领域的关键技术之一,传统的数据分析方法对现代复杂、高维的海量数据往往因“维数灾难”问题导致从中挖掘有用的特征信号变得十分困难。非负Tucker3分解(NTD)是一种新的多维张量分解算法,可以避免大尺度数据分解中出现的“维数灾难”问题,在特征提取中已被证实具有较强的适应性。研究表明,NTD能提取出反映目标对象本质的局部特征,并且二次特征具有良好的可解释性。目前,NTD算方法已被广泛应用于图像处理、盲信号分离、神经系统学、生物系统学和化学计量学等诸多领域高维数据的分析与特征提取。但是,传统的NTD算法对高维大尺度的非线性张量分解仍存在较多问题:第一,在迭代计算过程中容易陷入局部极值点而导致收敛慢,且提取出的特征稀疏性不足;第二,对于微弱的二次局部特征信号,尤其在噪声干扰的情况下,容易被覆盖而难以发现数据的本征;第三,迭代梯度下降方向选择的随机性和对每个分解因子交替更新计算的方式耗费了过多的计算时间,导致算法效率和精度下降。因此,如何进一步提高NTD算法的综合性能,并将其应用于设备的故障诊断实践是本文首要研究和解决的问题。对此,本文主要进行了以下几个方面的研究: 第一,针对二次特征不够稀疏的问题,提出了基于Tikhonov正则化的NTD算法,有效补偿了由误差造成的特征损失,提高了二次局部特征的质量;同时,针对弱信号特征不突出的问题,进一步提出了基于指数形式Tikhonov正则化的NTD算法,推导出了点乘的更新算式,优化了算法结构,降低了计算的复杂性,提高了计算效率。将这两种算法用于MIT CBCL人脸数据库的特征提取实验,结果表明两种算法均获得了稀疏性好、分布均匀和可识别性好的二次特征基图像,并且性能优于传统的NTD分解算法,验证了算法的有效性;同时,实验结果也表明了两种算法均具有较好的噪声抑制能力,鲁棒性强。 第二,针对传统NTD算法分解非线性高维张量并提取特征鲁棒性弱的不足,在Tucker3模型分解式的基础上,提出了基于核变换方法的NTD算法。在Choi-Williams分布函数的基础上,给出了指数形式的高斯特征密度基函数,同时,构建了相应的功率谱密度函数,以加强弱信号特征的能量;为了进一步提高二次特征的稀疏性,提出了结合稀疏分量分析的处理方法,有效抑制了噪声干扰,进一步增加了张量核的稀疏元数量。在MIT_CBCL人脸数据库和齿轮箱故障数据的特征提取实验中,提取出了可识别性好的二次特征,验证了提出算法的鲁棒性和有效性。 第三,提出了基于牛顿-高斯梯度下降的更新算法,实现了对所有分解因子的一次性更新计算,取代了传统算法一次更新一个分解因子的计算方式,同时,避免了梯度下降方向选择的随机性,提高了算法的收敛速度。在MIT_CBCL人脸数据以及齿轮箱等特征提取中的应用表明,基于牛顿-高斯梯度的更新算法相对于传统方法效率更高,收敛速度更快。 第四,为了进一步提高NTD算法的分解效率,提出了基于Lanczos算法理论的NTD算法,通过在Krylov子空间中对分解因子进行正交约束,使模矩阵或向量逐步增加、交叉相乘。同时,对张量核采用隐式块厚重启、模矩阵采用低秩运算减少了计算复杂度,有效提高了算法的整体效率。MIT_CBCL人脸数据的分解与应用表明,提出的算法在计算精度和计算效率上都有较大的优势;齿轮箱故障数据的分解实验也验证了所提出的方法的高效性,并且提取出的二次时频特征抑制了噪声的干扰,算法鲁棒性、特征稀疏性强,有效地解释了齿轮箱的故障类型。 第五,针对上述算法的优缺点和工程应用的需要,构建了面向空压机故障诊断的特征提取方案。提出了融合正则化处理和Lanczos理论的NTD算法,实现了空压机故障数据时频分布和频谱的二次特征提取,并进一步通过特征分布密度和功率谱分析,获得了清晰、稀疏、可解释性强的二次故障特征,所提出的算法效率高、鲁棒性强,验证了本文所提出方法的有效性。 上述研究成果不仅是对NTD算法理论的进一步完善和拓展,也是对现代特征分析和提取方法的有益补充,为非负分解算法应用于高维机械故障数据分解与特征提取打下了良好的基础。