基于粗糙集理论的知识发现应用研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：xuwh0415

【摘要】

：

随着现代信息技术的迅猛发展，知识发现（KDD）在科学和商业中得到了越来越广泛的应用。知识发现通过一定的技术手段从海量数据库中获取人们无法直接看到的有价值信息，并以此为人们

【作者】

：

沈睿芳

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2006年期

【关键词】

：

知识发现粗糙集维规约规则提取算法教学质量测评

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着现代信息技术的迅猛发展，知识发现（KDD）在科学和商业中得到了越来越广泛的应用。知识发现通过一定的技术手段从海量数据库中获取人们无法直接看到的有价值信息，并以此为人们的行为提供辅助决策。可以预见，未来的知识发现技术将为经济发展和社会进步提供强大的动力。另一方面，随着现实数据库的不断膨胀，对原始数据的规范和清理——即数据预处理变得日益重要，因为数据预处理作为知识发现的前期工作之一，其结果将直接影响到后续知识发现的效率和效果。粗糙集理论由于其独特的知识表示方法在数据预处理方面有着得天独厚的优势，同时也成为数据库中知识发现的有效手段。本文在介绍知识发现和粗糙集基本理论的基础上，重点研究了两个方面的内容。一是对知识发现中的数据预处理问题进行了系统研究。结合知识发现的主要应用平台——数据仓库，构建了一个基于数据仓库的数据预处理过程模型，并阐述了该模型的主要思想；进而对数据预处理中的维规约问题进行了重点研究，在总结归纳现有维规约算法的基础上，提出了一个基于粗糙集理论的双向选择维规约算法（BSDRA）。二是进一步研究了基于粗糙集理论的规则提取。针对已有的覆盖度因子可能将有价值的规则当作噪声规则误删除的情况，本文对覆盖度因子进行了修正与改进，定义了隶属度的概念，并将其作为过滤噪声规则的因子提出了带有隶属度因子的规则提取算法。将本文的理论研究内容应用于某高校的教学质量测评数据库，进行了相应的数据预处理和规则提取，在验证算法有效性的同时得出了一些有益的结论。

其他文献

基于移动Agent的协议分析系统的研究与实现

现有的协议分析器大多采用单一点结构,在网络中的一台主机上搜集并分析数据,不可避免地出现监控范围过小的问题,本文在深入理解移动Agent工作机制的基础上,利用Agent的移动性

学位

移动Agent协议分析分布式Aglet平台监测

基于XML的数据交换构件的研究与设计

企业信息化的基础平台将是Internet，XML已经成为Internet环境下数据表达的事实标准，而目前企业大量数据仍存在于占主导地位的关系数据库(简称RDB)中，如何在RDB与XML之间架起数据

学位

数据交换数据转换消息构件扩展的Java消息服务XML

基于XML数据库的数据查询优化的研究

XML语言已经成为互联网上表示和交换数据的标准，使得XML文档大量出现，因此如何查询XML文档变得更加重要。由于关系数据库有着技术成熟、应用广泛、数据管理能力强、数据安全程

学位

XML数据库查询查询优化查询重写

基于人工免疫的入侵检测系统模型研究

随着计算机互联网的发展和广泛应用，网络安全特别是网络入侵问题变得越来越严重。因此，开展网络安全特别是入侵攻击与防范技术的研究，开发高效实用的入侵检测系统，对计算机网络的

学位

入侵检测生物免疫系统人工免疫原理否定选择克隆选择

CORBA实现移动综合网管北向接口

目前我国各移动通信运营商大都拥有一个规模宏大的网络,如核心话务网、接入网、SDH和PDH传输网、分组交换网、智能网等多种电信网络。随着网络规模的不断扩大,网络设备的种类

学位

CORBA综合网管接口

基于Web服务的农业信息集成系统的设计与开发

本文针对我国农业信息多、广、散的特点以及农业信息网络的发展现状和存在的问题，研究并提出了使用Web服务技术集成农业信息。设计开发了基于Web服务的农业信息集成系统。在研

学位

农业信息集成Web服务消息传输格式传输协议服务接口

数字家庭控制中心体系结构研究及设备层设计

随着信息技术在全球范围的蓬勃发展，信息技术已经是无孔不入。各种数字产品日益渗透到社会生活的各个领域，数字家庭技术不断成熟。芯片和外围硬件的大幅度降价以及软件技术的迅

学位

数字家庭控制中心家庭服务器体系结构即插即控协议栈

基于点的造型与绘制技术的研究

随着计算机图形学的飞速发展，三维计算机图形学已经渗透到计算机应用的方方面面。人们对计算机造型与绘制技术的要求不断提高，计算机模拟场景的规模越来越大，景物的细节也越来越

学位

基于点的绘制基于点的造型Kohonen神经网络B样条曲面径向基函数神经网络非均匀有理B样条

Web Spam检测技术研究与实现

搜索质量是搜索服务的核心，决定了搜索引擎的质量。搜索引擎不但要搜索出相关性较高且符合用户需求的目标页面，同时也要针对低质量，甚至是人为“高质量”的作弊页面进行甄别和处

学位

作弊检测Web Spam文本相似度KNNLucene

无线传感器网络中的自身定位算法研究

无线传感器网络是微机电系统、片上系统和无线通信技术高度集成而孕育出的一种新型信息获取和处理模式。它在环境、健康、家庭、军事、空间探索和灾难拯救有广阔的应用前景,

学位

无线传感器网络自身定位算法各项同性各项异性

基于粗糙集理论的知识发现应用研究

其他学术论文