论文部分内容阅读
Bloom Filter算法是一种高效多哈希算法,它使用紧凑的数据结构以极小且可控的误差率表达一个数据集合,支持查询特定元素是否在集合中出现文中.基于Bloom Filter,针对元素出现频率呈重尾分布的特定集合,提出一种标记多重嵌套Bloom Filter(SMNBF)算法,采用带标记的多重嵌套方式存储集合中元素出现频率的信息.通过对算法的时间和空间复杂度以及误差比例的分析,结果显示该算法以较小计算代价和误差率,大幅减小计算所需的存储空间.将SMNBF算法应用于频率服从重尾分布的集合的实验结果表明,该算