论文部分内容阅读
随着工业生产的不断进步,常规的检测技术已无法满足所有的控制要求,因此软测量技术受到越来越多的关注。软测量建模是软测量技术的核心,各种建模方法层出不穷,各有侧重。其中,偏最小二乘算法(Partial Least Squares,PLS)凭借其在有效处理小样本、多噪声、变量严重共线等方面的优势,在工业软测量建模领域得到了广泛的应用。然而作为一种传统的线性建模方法,PLS拟合非线性数据效果欠佳,而现实工业过程中处理的数据往往呈现较强的非线性。因此,改进PLS的非线性建模能力已成为当今学者们研究的热点之一,本文也将针对此问题展开研究。本文的研究得到了国家自然科学基金、浙江省自然科学基金的资助,主要的研究工作和成果如下:(1)将核函数的使用与局部加权算法相结合,使在对非线性数据进行拟合时拥有双重保障。同时,在核PLS算法基础上,结合粒子群算法,提出核函数的自适应选择机制,使核函数与训练样本的映射关系更加符合数据分布特征,从而进一步提高模型的预测精度。(2)针对非时序非线性的数据,本文提出了基于K-means聚类算法的集成自适应核PLS算法。在模型训练过程中,首先利用K-means算法将数据进行空间聚类,然后通过自适应核PLS选择算法分别为各个子数据集选择最优核函数并建立相应的子模型。在预测过程中,提出先计算权值再判断各个子模型是否对输出作预测估计的思路,从而避免匹配度低的子模型进行无用的预测估计,减少模型计算量。在权值计算步骤中,提出了绝对邻域的概念,进一步提高了预测精度和运算效率。(3)针对时序非线性数据,本文提出了基于移动窗口技术的集成自适应核PLS算法。充分利用在线连续数据的时序特征:相邻数据特征相似,通过移动窗口判断数据在各时刻是否发生状态突变,从而对数据集进行划分,建立子模型。引用剪枝技术,删除冗余子模型,简化模型结构。在集成学习中,权值的计算同时考虑时域和空间域两个因素的影响,提高了模型的泛化能力。(4)将提出的上述两种集成非线性PLS算法应用到某焦化系统,建立了开工线温度预测软测量模型。并与传统线性PLS、全局核PLS、集成PLS的预测结果进行比较,应用结果表明:本文提出的两种改进算法对非线性数据拥有更高的预测精度、更优的泛化性能,同时也证明了此两种集成算法在实际工业中应用的可行性和有效性。