粗糙集在知识发现中的应用研究

来源 :对外经济贸易大学 | 被引量 : 2次 | 上传用户:qq1123388099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和信息时代的来临,各行各业都积累了大量的数据,数据库中存储的数据量急剧增加。因此,为了提高工作效率和生活质量,人们必须获取蕴藏在其中的有价值的信息。为了达到这个目的,人们开始致力于从数据库中发现知识的研究。然而,众所周知,数据库中往往存在冗余数据、缺失数据、不确定的数据和不一致的数据等诸多情况,这些数据成了发现知识的一大障碍。粗糙集理论是1982年同Pawlak Z提出,经历了20多年的发展,已经在理论和应用上取得了丰硕的成果。它不依赖于数据集之外的附加信息,是处理含有噪声、不精确、不完整数据的有力工具。许多知识发现技术仅仅适用于精确集,不适用于粗糙集,而现实中粗糙集是普遍存在的现象,因此基于粗糙集的知识发现模型在信息系统的研究领域具有重要意义。本文首先介绍了知识发现的历史、现状和可能的发展方向,并回顾了它的主要方法和技术。然后,论文对粗糙集理论进行了介绍,并对数据挖掘中的各环节运用粗糙集理论的方法进行了分析。随后论文重点对作者在数据离散方面做的研究工作进行了阐述。论文先提出了连续性数据离散定义的一般性数学描述,然后在此基础上通过对一种局部离散化方法的改进,提出了全局的离散化算法。该算法弥补了原算法引入不一致的缺陷,并在保持数据一致性的前提下,进一步分析了离散中分割点的冗余并进行了约简,并应用UCI中的机器学习数据库数据进行了验证,证明了改进算法的有效性。最后本文将对一真实的心脏病病人数据集,应用基于粗糙集的知识发现技术开发特征文件,得出一些有价值的模式,从而将有心脏疾病的人与那些未知心脏状况的人区别开人,为诊断提供参考,通过该案例以让大家对基于粗糙集的知识发现有更深的感性认识,并以证明其先进性和实用性。
其他文献
在我国加入世贸组织的新形势下,技术创新工作要面向国内国际两个市场、利用两种资源,加快培育企业的核心竞争力和技术创新能力,促使企业在更高层次、更广领域和更大范围参与
像飞虫撞进蜘蛛网,我们跌进了生活的大网,千丝万缕交织于我们身上,于是我们试图去看清生活的丝丝缕缕.但我想,倘若只是让折射的光线透过瞳孔投射在视网膜上,并不能称得上“看
阅读教学是语文教学中的重点,如何在课堂中引领学生获得最大的审美体验,是每一个语文教师都在思考的问题,多年的教学经验告诉我,教师运用自己的智慧在动机方法上给学生以引导
民俗节日是一个地区千百年来传承的符号,具有很强的人文色彩和浓重的文化底蕴,是旅游发展过程中的重要形态.民俗旅游开发对于我国旅游业发展具有重要影响,云南拥有26个少数民
随着银行业竞争的日益激烈,商业银行的效率问题再次成为人们关注的焦点。本文运用非参数法中的数据包络分析法(DataEnvelopmentAnalysis,DEA),对我国14家有代表性的商业银行1999
本文通过对荣华二采区10
访谈是在《舞林大会》明星排舞大厅的一个角落里进行的。方俊很健谈,说话也很有条理。他自始至终都很配合我们的采访,有问必答,之前小心翼翼准备的敏感话题他也毫无避讳地畅
近年来,教学改革不断深入,教师在教学的过程中越来越重视高效教学课堂的建设.本文文中主要介绍了小学生语文高效教学的方法.
本文从定性与定量两个角度阐述指数化股票期权激励制度的有效性,并与传统股票期权激励制度进行比较。  首先,介绍股票期权激励的定义及分类,接着引出指数化股票期权激励模型,定
近年来,家长越来越重视学生的全面发展,使学生能够更好的发展.本文中主要介绍了小学英语教学听说读写习惯的培养.