论文部分内容阅读
应用粗糙集对知识分类的特点,结合遗传算法进化理论,提出了新的数据挖掘模型;针对大数据表字段过多、信息冗余大的特点,采用粗糙集的理论方法进行处理,在改进数据预处理方法的基础上,对条件属性进行约简,提出了改进的属性约简算法;指出对于数据量大的决策表仅仅属性约简是不够的,对大量的规则还要进行筛选提取,结合遗传算法进行优化筛选处理,通过选择、交叉、变异后从大量的规则中得到较优的规则集。