【摘 要】
:
数据挖掘是从大型数据库中提取隐含的、预先不知道的、潜在有用的信息。属性约简作为粒计算、粗糙集等软计算理论中关键的一部分,在数据挖掘起着非常重要的作用,一个好的属性约
论文部分内容阅读
数据挖掘是从大型数据库中提取隐含的、预先不知道的、潜在有用的信息。属性约简作为粒计算、粗糙集等软计算理论中关键的一部分,在数据挖掘起着非常重要的作用,一个好的属性约简算法,可以减少计算的复杂度,提高数据挖掘的效率。粒计算作为近年研究领域的热点之一,为数据挖掘研究的许多方面提供了理论上的框架。近年来,许多学者从各自不同的学科领域对粒计算进行了深入的研究,并取得了很多成果。
本文运用粒计算的思想和方法,提出了一种新的快速属性约简算法—FARA(Fast Attribute Reduction Algorithm)。算法包括运用基于回溯的基数排序算法求不可分辨关系、求正域、求核、求属性约简四个部分。其中求核的时间复杂度成功地降为,然后,运用改进的属性重要度作为启发信息,得到求属性约简的算法的时间复杂度为。因此,算法在很大程度上减少了约简所花费的时间,提高了约简的效率。另外,在此过程中,通过严密的定理和推论证明了算法的正确性和高效性。作为课题的一部分,设计开发了FARA对应的属性约简系统—FARS(Fast Attribute Reduction System)。在系统中除实现了FARA外,还实现了作者刘少辉等在文献[32]中提出的高效完备的属性约简算法,及徐章艳等在文献[33]提出的快速约简算法,以和本文FARA进行详细的比较。最后,运用UCI机器学习库中的一些数据集对三种算法进行测试,通过对测试结果的分析,证明了FARA对大型的数据集进行属性约简的高效性。
其他文献
目的 探究浅析乙型肝炎肝衰竭患者发生肝性脑病的危险因素.方法 选择我院2016年11月~2019年11月收治的92例乙型肝炎肝衰竭患者,将46例乙型肝炎肝衰竭患者分为对照组,46例乙型
目的 探究肺炎支原体感染与哮喘患儿发病的关系.方法 选取2018年10月~2019年11月于我院诊治的哮喘患儿98例,根据患儿有无患病的不同将其分为:健康儿童的对照组(n=49例)和哮喘
通常认为,信息化是强化政府管理的一种创新手段,其工具属性显而易见。但笔者认为,信息化通过改变信息存储、处理与传递的方式,从根本上改变了政府工作的基础环境。可见,政府
随着“互联网+”行动计划于2015年上升为国家战略,我国互联网的发展呈现出更加广阔的前景。网络视频的广泛应用促使关键的流媒体传输技术不断发展。流媒体传输在移动互联网中
自动摘要是文本挖掘的一个传统研究领域。本文设计了两种面向不同领域的自动摘要生成策略,分别为面向移动终端的移动摘要技术和面向观点挖掘的观点摘要技术;而观点摘要又分为
当代著名意大利学者安贝托.艾柯先生数十年来一直致力于符号学与阐释学的研究,他的阐释学思想对当代西方文论中的接受理论给予了深远影响。早在20世纪60年代,艾柯就在学术著
鹤壁矿务局专用电话网于lop年7月完成程控改造,为了满足矿务局电话用户对长途直拨业务的需求,提高专用电信网的服务质量和服务等级,经过反复对比及论证,决定以加字冠的形式开放专
档案法颁布以来,档案的立法取得巨大的成就,党和国家制定的关于档案事业一系列方针、政策已用法律形式固定下来,为档案事业的健康发展提供了法律保障。
Since the enactment
随着计算机技术的快速发展和广泛应用,图片排版技术已经成为提升工业生产效率有力的工具。传统的图片排版方法版面利用率低,造成相纸的大量浪费。因此,研究一种版面利用率高的排
目的 对终末期肾病患者应用血液透析进行治疗并对其血糖影响及干预效果进行分析研究.方法 选择2017年5月~2019年6月间到我院就诊的168例终末期肾病患者作为研究对象,根据是否