知识发现数据预处理方法及SVM应用的研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:memory_prince
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的到来,促使知识发现问世,可以有效解决从海量数据中挖掘知识。数据预处理是知识发现过程的重要组成部分,直接影响到数据挖掘效率和知识模型的质量。研究数据预处理,尤其是数据清洗和数据补齐,具有理论意义和实用价值。 在数据清洗和数据补齐技术进行综述的基础上,针对比较简单的数据降噪,应用分箱技术和回归分析来实现降噪;含噪数据在频域和时域变化的比较复杂时,应用小波变换中的Mallat算法进行降噪。经过真实工程数据实验表明,Haar小波基可以应用于石油领域内的数据降噪。针对缺失数据,根据SVM在函数拟合方面的特点,建立了一个函数模型。通过确定主要影响因子和选定数据集后,对该模型进行训练,最后成功地应用于缺失数据补齐。经过真实工程数据实验证实,基于SVM的缺失数据补齐方法具有明显的实用性。在基于支持向量机的对象分类识别的算法上,对SVM其中比较重要的参数进行了优选,提高了对象分类的正确率;在此基础之上,结合实际需要加入一个判断函数,进一步提高了SVM分类器的分类正确率。试验表明:SVM分类器应用于地层识别效果良好。 本文所用的各种数据预处理方法和基于SVM的对象分类识别算法具有广阔的应用前景,不但可以应用于石油领域内数据的知识发现,也可以应用于其它需要知识发现的工程领域。
其他文献
无线传感器网络(Wireless sensor networks,WSN)是由若干具备无线通信能力的传感器节点按照协议自组成的分布式网络。无线传感器网络技术一门新兴综合技术,它在环境监测,国防军
公开密钥基础设施PKI(Public Key Infrastructure)是一种利用非对称密码技术为电子商务、电子政务和电子事务的开展提供一整套安全的基础平台。PKI技术遵循国际标准,采用加密
Internet的广泛应用以及各种复杂计算机应用的出现,各种攻击技术的层出不穷以及攻击的自动化,导致现在的Internet面临前所未有的网络安全威胁,如何有效地分析这些威胁,包括宏观上
随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息。数据挖掘就是利用分析工具从大量的、不完全的、
随着网络的普及,社交服务得到了快速发展,社交网络已经逐渐成为人们日常交流的主要工具,吸引着越来越多的用户加入其中。在学术领域中,伴随国内外各高等院校以及各研究机构在科研
服务器集群技术不但能有效的利用原有的软硬件资源,同时还具有高可用性,高可靠性以及可扩展性等优势。因此,服务器集群的应用日益广泛,但是服务器之间负载的不平衡性与提高集群系
认证密钥交换协议主要用于用户间安全密钥的分发,为用户进一步使用会话密钥进行安全通信提供安全基础,是一种重要的密码学原语构件。本研究重点关注于设计攻击者能力更强的协议
文摘是一项需要耗费大量时间和人力的工作,在进入上世纪中叶后,随着信息量的膨胀,人工文摘已经越来越无法满足需求,自动文本摘要应运而生。早期的自动文本摘要主要是应用启发式的
学分制是随着现代教育改革而发展起来的一种新型管理模式,在学分制下学生不再局限于学习年限,只需达到毕业学分即可毕业;同时,学生还可根据自己的兴趣爱好对所修课程进行自由选择
随着企业应用规模的不断扩大,企业信息孤岛和应用孤岛现象越来越严重,企业迫切需要对各种信息和应用进行有机集成。为此,在国家“十五”科技攻关项目的支撑下,把MAS技术应用到企