集成自适应核PLS软测量建模方法及应用研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:snmn777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业生产的不断进步,常规的检测技术已无法满足所有的控制要求,因此软测量技术受到越来越多的关注。软测量建模是软测量技术的核心,各种建模方法层出不穷,各有侧重。其中,偏最小二乘算法(Partial Least Squares,PLS)凭借其在有效处理小样本、多噪声、变量严重共线等方面的优势,在工业软测量建模领域得到了广泛的应用。然而作为一种传统的线性建模方法,PLS拟合非线性数据效果欠佳,而现实工业过程中处理的数据往往呈现较强的非线性。因此,改进PLS的非线性建模能力已成为当今学者们研究的热点之一,本文也将针对此问题展开研究。本文的研究得到了国家自然科学基金、浙江省自然科学基金的资助,主要的研究工作和成果如下:(1)将核函数的使用与局部加权算法相结合,使在对非线性数据进行拟合时拥有双重保障。同时,在核PLS算法基础上,结合粒子群算法,提出核函数的自适应选择机制,使核函数与训练样本的映射关系更加符合数据分布特征,从而进一步提高模型的预测精度。(2)针对非时序非线性的数据,本文提出了基于K-means聚类算法的集成自适应核PLS算法。在模型训练过程中,首先利用K-means算法将数据进行空间聚类,然后通过自适应核PLS选择算法分别为各个子数据集选择最优核函数并建立相应的子模型。在预测过程中,提出先计算权值再判断各个子模型是否对输出作预测估计的思路,从而避免匹配度低的子模型进行无用的预测估计,减少模型计算量。在权值计算步骤中,提出了绝对邻域的概念,进一步提高了预测精度和运算效率。(3)针对时序非线性数据,本文提出了基于移动窗口技术的集成自适应核PLS算法。充分利用在线连续数据的时序特征:相邻数据特征相似,通过移动窗口判断数据在各时刻是否发生状态突变,从而对数据集进行划分,建立子模型。引用剪枝技术,删除冗余子模型,简化模型结构。在集成学习中,权值的计算同时考虑时域和空间域两个因素的影响,提高了模型的泛化能力。(4)将提出的上述两种集成非线性PLS算法应用到某焦化系统,建立了开工线温度预测软测量模型。并与传统线性PLS、全局核PLS、集成PLS的预测结果进行比较,应用结果表明:本文提出的两种改进算法对非线性数据拥有更高的预测精度、更优的泛化性能,同时也证明了此两种集成算法在实际工业中应用的可行性和有效性。
其他文献
随着用户对通信业务需求的不断提高,下一代移动通信系统的数据速率将会大大提高,人们已经把目光越来越多地投向第四代(4G)移动通信系统中。实践证明,CDMA与正交频分复用(OFDM
水是生命之源,文明之本。近年来,随着我国城市化进程加快,城市暴雨内涝频发,城市面源污染严重。为此国家提出以低影响开发雨水利用为核心的海绵城市建设战略,低影响开发雨水
船舶导航雷达是船舶航行的安全保障,在船舶的濒海定位、出入港引导、恶劣天气行船等场景中占据着重要地位。雷达接收机射频前端是雷达的重要组成部件,振荡器和混频器作为雷达
生物质能源不仅具有可再生性,取之不尽,用之不竭,而且还具有着低碳环保的优点。废弃的秸秆,谷壳等生物质通过生物质气化技术可以被转化为可燃气体,生成的气体还可以直接燃烧
滤泡辅助性T细胞(Follicular helper T cell,Tfh)是一类定位于淋巴组织B细胞滤泡中,促进B细胞活化、产生特异性自身抗体的CD4+T细胞。在自身免疫病等病理情况下,Tfh细胞可迁
背景:大量临床试验表明保护内皮细胞功能以及促进受损内皮功能的恢复是冠心病防治的关键环节,高血压是冠心病、导致内皮损伤的重要危险因素之一。内皮祖细胞(Endothelial pro
传统的肿瘤化疗药物主要为细胞毒化药和抗代谢药,由于它们选择性低,在治疗肿瘤时对正常细胞也有影响,因此,早期的化疗药物毒性大、副作用强,病人难以接受或在治疗过程异常痛
随着以AP1000等三代核能发电技术日渐成熟,核能发电也逐渐被赋予为国家经济高速发展提供稳定能源的重任。然而鉴于苏联切尔诺贝利事件、日本福岛事件等核岛事故的发生,如何更
日语的「必ず」和汉语的“一定”是近义词,都有表示“推量”、“意志”和“请求”等用法,但「必ず」和“一定”的各种用法却不尽相同。以汉语为母语的日语学习者在学习「必ず
随着汽车制造成本的大幅降低和我国国民人均收入的快速提高,汽车这一昂贵的消费品也像普通商品一样走进了千家万户,但迅猛增长的车辆对交通管理工作人员带来了严峻的压力。利