论文部分内容阅读
近年来,随着数据挖掘技术的不断发展,其应用领域也在不断扩大,比较典型的数据挖掘算法在流程工业领域便得到了大力的推广。这主要有两方面原因:一是伴随着以计算机为核心的各种控制系统和各种生产经营管理系统的广泛应用,许多流程企业积累了大量有关生产过程的历史数据。海量的数据增强了对数据分析工具的需求,由此数据挖掘技术应运而生,并在科学研究、商业等诸多领域得到广泛的应用。二是在流程工业企业中,由于信息技术的飞速发展和智能控制设备的广泛应用,以及计算机网络技术的进步,使数据挖掘技术应用于流程工业中的条件日益成熟。鉴于实际流程工业过程的复杂性、非线性、耦合性和实时性等特点,寻求合适的数据挖掘算法来获取海量数据背后蕴涵的有效知识,用于过程控制和决策分析,已经成为当前的一个主要研究目标。论文以粗糙集理论和模糊关联规则挖掘算法为工具,以水泥工业企业为背景,对数据挖掘技术在流程工业中的应用进行了研究。粗糙集理论由波兰数学家Z. pawlak于1982年提出,是一种处理含糊和不精确性问题的新型数学工具,能有效地分析不精确、不一致等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规则,已在机器学习、知识发现、专家系统与智能控制等领域得到了成功应用。其基本思想是在保持分类能力不变的前提下,通过属性约简,导出分类规则。利用粗糙集理论的属性约简算法,对优化流程工业中的众多参数进行约简,挖掘参数间的关联关系具有重要的意义。关联规则揭示的是各数据项之间的内在关系,是数据挖掘的一个重要研究领域,最初的关联规则挖掘算法主要应用在零售业。流程工业中也存在大量关联规则,如何将关联规则挖掘技术应用到其中,为流程工业中的生产决策提供有效的依据,是本文的研究内容。本文利用陆建江等人提出的基于语言值的模糊关联规则挖掘算法,又通过改进的多步递推方法挖掘出属性间的关联规则,去除了冗余规则,明显地提高了挖掘效率,对于优化参数提出了建议性的规则,提高了装置运行的平稳性和控制效果得到了明显改善,进一步说明了该算法的合理性、实用性。流程工业中控制对象之间的关联规则挖掘,可以协助研究人员根据需要建立不同的控制模型,对实时控制具有现实意义和一定的应用价值。