基于粗糙集理论的知识发现应用研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:xuwh0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术的迅猛发展,知识发现(KDD)在科学和商业中得到了越来越广泛的应用。知识发现通过一定的技术手段从海量数据库中获取人们无法直接看到的有价值信息,并以此为人们的行为提供辅助决策。可以预见,未来的知识发现技术将为经济发展和社会进步提供强大的动力。另一方面,随着现实数据库的不断膨胀,对原始数据的规范和清理——即数据预处理变得日益重要,因为数据预处理作为知识发现的前期工作之一,其结果将直接影响到后续知识发现的效率和效果。粗糙集理论由于其独特的知识表示方法在数据预处理方面有着得天独厚的优势,同时也成为数据库中知识发现的有效手段。本文在介绍知识发现和粗糙集基本理论的基础上,重点研究了两个方面的内容。一是对知识发现中的数据预处理问题进行了系统研究。结合知识发现的主要应用平台——数据仓库,构建了一个基于数据仓库的数据预处理过程模型,并阐述了该模型的主要思想;进而对数据预处理中的维规约问题进行了重点研究,在总结归纳现有维规约算法的基础上,提出了一个基于粗糙集理论的双向选择维规约算法(BSDRA)。二是进一步研究了基于粗糙集理论的规则提取。针对已有的覆盖度因子可能将有价值的规则当作噪声规则误删除的情况,本文对覆盖度因子进行了修正与改进,定义了隶属度的概念,并将其作为过滤噪声规则的因子提出了带有隶属度因子的规则提取算法。将本文的理论研究内容应用于某高校的教学质量测评数据库,进行了相应的数据预处理和规则提取,在验证算法有效性的同时得出了一些有益的结论。
其他文献
现有的协议分析器大多采用单一点结构,在网络中的一台主机上搜集并分析数据,不可避免地出现监控范围过小的问题,本文在深入理解移动Agent工作机制的基础上,利用Agent的移动性
企业信息化的基础平台将是Internet,XML已经成为Internet环境下数据表达的事实标准,而目前企业大量数据仍存在于占主导地位的关系数据库(简称RDB)中,如何在RDB与XML之间架起数据
XML语言已经成为互联网上表示和交换数据的标准,使得XML文档大量出现,因此如何查询XML文档变得更加重要。由于关系数据库有着技术成熟、应用广泛、数据管理能力强、数据安全程
随着计算机互联网的发展和广泛应用,网络安全特别是网络入侵问题变得越来越严重。因此,开展网络安全特别是入侵攻击与防范技术的研究,开发高效实用的入侵检测系统,对计算机网络的
目前我国各移动通信运营商大都拥有一个规模宏大的网络,如核心话务网、接入网、SDH和PDH传输网、分组交换网、智能网等多种电信网络。随着网络规模的不断扩大,网络设备的种类
本文针对我国农业信息多、广、散的特点以及农业信息网络的发展现状和存在的问题,研究并提出了使用Web服务技术集成农业信息。设计开发了基于Web服务的农业信息集成系统。在研
随着信息技术在全球范围的蓬勃发展,信息技术已经是无孔不入。各种数字产品日益渗透到社会生活的各个领域,数字家庭技术不断成熟。芯片和外围硬件的大幅度降价以及软件技术的迅
随着计算机图形学的飞速发展,三维计算机图形学已经渗透到计算机应用的方方面面。人们对计算机造型与绘制技术的要求不断提高,计算机模拟场景的规模越来越大,景物的细节也越来越
搜索质量是搜索服务的核心,决定了搜索引擎的质量。搜索引擎不但要搜索出相关性较高且符合用户需求的目标页面,同时也要针对低质量,甚至是人为“高质量”的作弊页面进行甄别和处
无线传感器网络是微机电系统、片上系统和无线通信技术高度集成而孕育出的一种新型信息获取和处理模式。它在环境、健康、家庭、军事、空间探索和灾难拯救有广阔的应用前景,