【摘 要】
:
化工生产中产生大量的过程数据,这些数据蕴含着生产优化、质量管理、过程控制的相关信息。已有的关联规则挖掘应用领域涉及到商业、金融、电信、零售等行业,这些行业的过程以
【出 处】
:
中国科学院研究生院 中国科学院大学
论文部分内容阅读
化工生产中产生大量的过程数据,这些数据蕴含着生产优化、质量管理、过程控制的相关信息。已有的关联规则挖掘应用领域涉及到商业、金融、电信、零售等行业,这些行业的过程以事务处理为背景,这些事务本身比较简单,目的也比较明确,其关联规则挖掘方法不适用于化工生产过程中数据维数多、变量间耦合和非线性等特点。本文将关联规则挖掘应用到化工行业中,挖掘出化工行业中的关联规则从而指导生产、提高生产质量和效率等。
本文以化工生产过程数据分析为研究背景,根据化工生产过程复杂的特点,提出了适用于化工生产的过程变量权值计算方法和关联规则挖掘算法,实现了一个关联规则挖掘原型系统,并成功应用于化工生产中,给出了合成氨产量降低的原因。
论文的主要工作包括:
·提出了一种基于信息熵的权值计算方法。历史数据中蕴含了有关生产规律的信息,利用信息熵理论计算变量的信息增益,得到各过程变量对目标产品的影响程度,即各变量的权值,使其满足化工生产中维数多、变量间耦合和非线性的特点,符合化工生产实际。
·提出了一种基于动态项集计数的加权频繁项集算法。该算法通过将基于信息熵得到的过程变量权值引入加权频繁项集的算法中,使挖掘出的加权频繁项集满足化工生产中维数多、变量间耦合和非线性的特点。大量实验表明我们的算法比经典算法具有较高的性能。
·设计并开发了一个适用于化工生产的关联规则挖掘原型系统。以影响合成氨产量降低的原因分析为例,详细介绍化工生产过程中合成氨生产关联规则挖掘的过程,验证本文研究成果的正确性及其应用价值。
其他文献
最近,随着互联网上信息的逐渐增多,信息的高效获取、智能获取越来越重要。于是有关语义搜索研究的讨论也越来越多。语义网的概念被提及的频率也越来越高,互联网上的两大搜索
由于网页更新的速度迅猛和数量日益膨胀,如何将海量的网页按照更友好、以用户更满意的方式聚类和展示成为很重要的一个问题。时间属性作为网页信息的一个重要特征,使得准确地
随着计算机网络的发展和Web开发技术的日臻成熟,Web正从传统意义下的静态信息发布媒介演变成为一种开放分布的计算环境,同时Web应用也逐渐成为构建企业业务系统的主流方式。如
随着科学技术不断进步和经济的快速发展,制造企业之间的竞争逐渐从过去的基于品种、价格、质量竞争转为基于时间的竞争(Time-based Competition,TBC)。同样品质的产品,准时交
近年来随着普适计算的迅速发展,基于IEEE802.11标准的无线通信技术得到越来越广泛的应用。无线技术为人们的通信、娱乐、计算提供了便利,然而无线环境具有网络信道带宽窄、网络
云计算强调计算环境的灵活性,要求计算平台支持按需分配、动态调整、快速部署、及时解散等功能。系统级虚拟化技术被认为是能满足以上需求的关键技术,已被应用于搭建云计算的
随着信息化的不断深入,数据的处理越来越呈现出海量,分布式,并行等特点,MapReduce框架以其简单性,低成本,高可伸缩性,高效性,受到了企业和科研机构的极大关注,并得到了广泛应
软件成本估算和管理是软件项目管理的核心任务之一,是项目计划、资源调度及人员分配的重要参考依据。在过去的几十年中,软件工程研究领域提出了大量的软件成本估算方法,但这
基于构件的模型驱动开发被认为是实现软件复用和降低系统开发复杂度的重要技术之一,并已在工业界得到广泛应用。其基本思想是:根据不同的视角和关注点将系统分解为不同模型,然后
基于计算机视觉的多点触摸交互桌面提供了一种自然的交互手段,成为国内外研究机构的研究热点。基于计算机视觉的多点触摸交互桌面环境噪声干扰严重,多个触摸手指之间相互遮挡