论文部分内容阅读
算法采用了一种新颖的质数编码方式,将数据库属性项压缩为一个数值型的项,把原来用字符串表示的记录转化为用一个合数表示,进而把字符串比较转化为数值运算。通过引入频繁项集估计数目,使算法总是在频繁项密集区进行挖掘,对搜索空间进行了有效修剪。实验表明,算法对数据库压缩比超过25%,效率至少能提高49%。