数据挖掘技术在污水处理中的

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:cj304465902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,工业和生活的用水增加,排放的污水量增加,为了让人们能喝到干净的水,污水处理技术在人类生存的迫切需求之下快速的发展;污水处理过程不是一种简单的污水过滤,其工艺过程极其复杂,目前污水处理的数据处理、控制过程、故障诊断等都与数据挖掘技术息息相关;数据挖掘是从大量的数据集中提取出隐含的、未知的、潜在的有用知识的过程。污水处理过程工艺的复杂性导致污水处理数据的大量、多样、高维等特点,使得监控污水处理信息的采集属性很多;工艺设备处理过程的故障通常反应在监控采集的数据上面,因此可以通过对监控设备采集来的污水处理数据信息进行异常数据挖掘,来发现工艺设备异常行为和模式。现在传统的异常挖掘算法对采集的信息数据的单个或几个属性进行数据挖掘,表现出较好的效果,但对于数据的高维属性集之间存在较高的耦合性、关联性等导致传统的基于距离和密度的聚类算法效率降低,达不到预期效果。  针对传统聚类算法的初始聚类中心很难确定的问题,本文利用遗传算法确定初始聚类中心;遗传算法具有很好的全局搜索能力,可以搜索到最优或较优的聚类中心点,利用搜索到的初始聚类中心来确定初始聚类中心距离,利用初始聚类中心距离来划分数据集,在局部数据集上采用DBSCAN聚类算法进行聚类操作,采用遗传聚类算法对UCI污水数据进行处理,分析实验结果:  针对污水处理数据的高耦合性与高维性,本文引入信息熵的概念,定义了属性熵、异常属性、异常属性子集与异常属性子空间的概念,提出了基于信息熵的子空间聚类算法来解决污水数据的高维问题,利用改进的子空间聚类算法对UCI污水数据进行处理,分析实验结果。  本文利用遗传思想来改进的DBSCAN算法,通过实验分析在聚类效率、时间复杂度上较DBSCAN算法要好;采用基于信息熵的子空间聚类算法,通过实验分析在聚类效率、时间复杂度上较传统子空间聚类算法要好。
其他文献
随着微电子技术的发展和嵌入式系统功能越来越强大,系统能耗已经增加到电池供电和风冷散热的极限,成为制约嵌入式发展的瓶颈。所以低功耗设计是嵌入式设计中需要考虑的重要因
微博以其发布简单,接入方便,无需专业的编辑技能和较强的逻辑推理论断,最大限度的提升了微博的可用性。与此同时,微博以其言论的自由性、平台的开放性和传播的迅速性所形成的
近些年无线网络的应用越来越广泛,无线网络的基础理论与关键技术的研究具有更加重要的科学意义和经济价值。传统拥塞控制协议在无线计算机网络中性能表现不佳,使得对无线网络中
随着移动互联网技术的发展,大批量的多媒体服务涌现在现有的网络环境中,加之各种便携式移动设备通过无线的方式接入到网络中,使得网络带宽资源常显不足,并影响到网络传输服务
改革开放以来,关于大型堤坝安全监控指标研究比较成熟,大型堤坝抵御风险能力不断地增强,改变了过去因洪涝灾害发生危及堤坝安全的状况。但是,中小型堤坝安全隐患仍然存在,经常发生
随着科技的进步,电子词典得到了广泛的应用。当前,国内知名的电子词典产品主要针对英语单词的查询,并没有涉及积分等复杂公式的计算和查询。但是数学又非常的重要,它是一切自
目前计算电磁学是电子工程科学中的一个重要研究领域。随着计算机硬件与相关算法的发展,电磁仿真科学在民用与军用方面都得到了广泛应用。本文使用计算机图形学的加速技术对
近年来,中国在国际舞台上开始扮演越来越重要的角色,然而与此不相映衬的却是中国的服装行业同国外服装行业相比,显得竞争力较为薄弱。对于这种境况,国内服装行业越来越意识到
图像配准是图像分析和理解的关键环节,是将不同时间、不同的传感器(成像设备)和(或)不同条件下(天候、照度、摄像位置和角度等)获取的同一场景的两幅(或多幅)图像进行匹配、叠加的处
作为能够快速、无痛苦、准确并且可以提前诊断的诊病方式,中医学的手掌诊病得到了普遍的认可。中医专家根据手掌不同位置、不同的纹理、色泽等信息就可以得出诊断,这样就可以