论文部分内容阅读
随着空间技术的不断发展,更多的空间数据被使用,空间数据挖掘是从空间数据库中提取隐含的、用户感兴趣的空间和非空间的模式、普遍特征、规则和知识的过程。空间co-loctation模式挖掘是一类空间数据挖掘问题。空间co-lotation模式是一组空间特征的子集,它们的实例在地理空间中频繁地一起出现。co-looation模式挖掘算法研究已经成为空间数据挖掘研究领域中非常活跃的一个研究课题。
本文首先介绍数据挖掘和空间数据挖掘的概念及方法,然后介绍co-looation模式挖掘的相关概念,分析了几种具有代表性的co-loctation模式挖掘算法,接着,采用FP-CM算法与投影频繁模式树(PFP-tree)及其它技术相结合的方法,提出了一种基于投影FP-growth的co-loctation挖掘算法,称为PFP_CM算法。PFP_CM算法扫描数据库的次数只是一个小常数,另外,由于该算法避免了大量的表实例的连接操作,大大节省了算法的运行时间。
本文使用matlab实现了新算法和著名的join-based算法,实验证明新算法确实比join-based算法具有更高的效率。同时,将其用于三江并流地区稀少植物的挖掘,找出共生物种,对植物学家具有一定的指导意义。