论文部分内容阅读
Apriori算法是最为著名的关联规则挖掘算法,它采用基于频集理论的递推方法,挖掘出的分类规则,具有准确率高,可理解性强的优点.但是,由于Apriori算法使用支持度-置信度框架,无法挖掘出支持度小的稀有信息,而且也没有考虑到项之间的关系,因而会影响分类的准确性.Brin等人于1997年首次提出了项的相关性的概念,他们在生成规则时既考虑到了频繁的项也考虑到了非频繁项,挖掘出的相关规则能够识别项之间的相关性.Xindong Wu等人在Brin的基础上又提出了挖掘出正向相关规则和负向相关规则的算法.Hui Xiong等人发现了相关系数的上界以及上界的单调性,提出了正相关对的挖掘算法.后来钱铁云等人又发现了相关系数的下界及其单调性,提出了负相关对的挖掘算法.
本文通过应用Phi相关系数上界和下界的性质来修剪正、负相关相对的搜索空间.在Pumsb Start和Connect数据集上的实验表明,加入Phi相关系数上下界性质约束后,运行时间相对于修剪前的运行时间大为缩短。