论文部分内容阅读
在数据库知识发现的过程中,特征选取作为一个重要的步骤,它通过去除无关/冗余属性,以提高数据挖掘算法的效率和性能。粗糙集合作为知识发现的一种形式化框架,使用缩减和相对缩减来阐述特征选取。在此基础上,Skowron A.等提出了区分矩阵作为计算缩减和相对缩减的工具。但是由于区分矩阵的空间复杂度为O(ㄧUㄧ〈’2〉*ㄧAㄧ),难以应用于实际的数据库。该文基于粗糙集合的理论框架,利用最近邻的思想,提出了一个特征子集选取的算法RSNN_FS来计算决策表的近似缩减。该算法具有良好的空间复杂性,具有渐近式能力,以及抗噪音能力。