论文部分内容阅读
结合属性重要度和灰色关联度,提出了一种新的数据补齐方法,可使补齐后的数据具有更高的识别率和分类性能。按照属性重要度确定各个条件属性的补齐顺序;对于当前要补齐的缺失样本,将所有完备样本分别与其进行比较,并选择灰色关联度最大的完备样本对该样本的缺失数据进行补齐。并提出了一种新的判断数据补齐性能的评价标准,即补齐后的数据不能影响原有数据的识别率。实验结果表明,即使在很高的数据缺失比率下,该方法仍能很好地进行补齐,并能取得较高的识别率。