正负co-location规则挖掘算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:ynshisss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着空间数据库的快速增长和广泛使用,如何从空间数据中自动地发现空间知识变得越来越重要。空间co-location模式挖掘寻找给定空间属性之间的关联关系,是数据挖掘的主要研究方面。传统的co-location模式挖掘算法仅能挖掘正co-location模式,也就是空间属性的实例在地理空间频繁关联。事实上,负co-location模式,那些挖掘co-location模式时达不到给定阈值而它们之间又有很强负相关性的模式,有时也可能包含了非常有价值的信息,对于决策的作用是不容忽视的。例如在三江并流地区,沧江新樟和长苞冷杉常一起出现,长苞冷杉和虫草常一起出现,而当长苞冷杉和虫草同时出现时,基本上不会出现沧江新樟,这一模式表明长苞冷杉、虫草与沧江新樟之间存在负相关,有利于我们寻找这一地区的植物生长位置。现在还没有发现负co-location模式方面的研究工作,结合我们三年来对co-location模式在植物数据挖掘方面的应用研究,负co-location模式的提出和研究是非常有意义的。 本文首先介绍了空间数据挖掘的基本概念及其研究现状。 其次,介绍了co-location模式的相关概念,分析了co-location模式挖掘的实质和近年来提出的三类co-location模式挖掘算法,并对负关联规则的概念和挖掘方法进行阐述。 接着,给出了负co-location模式的定义及其相关定理的证明,指出了负co-loc~Ltion模式挖掘的难点,候选的非频繁模式数量的急剧增长。针对这一点,提出了减少候选非频繁模式的负co-location模式挖掘算法,即正负co-location模式挖掘算法,并对算法正确性和复杂性进行了分析。 最后,在植物数据上进行多次实验,实验结果表明本文所提出的算法是正确和有效的。
其他文献
软件演化已成为软件生存周期中最重要的形态之一,进入了软件的各个领域,成为了今天软件工程研究的热点领域。软件演化的过程表现出了明显不同于传统软件过程的特征。因此,有必要
数据分类技术是数据挖掘中一种强有力的分析手段,它旨在生成一个分类函数或分类模型,由该模型把数据库中的数据项映射到某一给定类别中。现有的数据分类算法大体可以划分为两大
数据挖掘是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。数据挖掘技术经过十多年的发展,已经逐渐建立起系统的挖掘理论和成熟的挖掘
数据挖掘是在海量的数据中提取隐含的、未知的、潜在有用的知识或信息模式的决策支持方法。在信息爆炸的今天,数据挖掘显得尤为重要。 一个人的噪声可能是另一个人的信号,忽
随着移动通信的迅速发展,移动通信业务从传统的话音业务向以Internet接入和多媒体业务为主方向发展的趋势已经清晰可见。未来移动通信的目标在于建立一个无处不在的全IP分组数
真实感图形渲染是计算机图形学发展的一个重要方向,而目前的渲染技术都是基于物理的方法,通过模拟光线在场景中反射及折射反映出场景中的光照情况,从而通过计算光能来渲染出场景
快速、准确的手势跟踪系统具有广阔的应用前景。由于特殊的穿戴式硬件造价高昂,并且设备本身还会限制自由,因此近年来,基于廉价摄像机的手势跟踪系统成为了人本界面的重要研究课
多标签分类问题是指一个样本同时属于多个类别或具有多个标签的问题,是最为复杂的分类问题之一,目前已经应用于蛋白质分类、音乐归类、场景分类、多媒体对象自动标注、信息检索
图像非真实感绘制(Non-photorealistic rending:NPR)技术已经被广泛的应用于数码相机、手机,但作为数码相机的伴侣产品,如何将NPR技术和数码像框进行有机的结合,使数码像框能够
闪存有两种类型:NOR型闪存和NAND闪存,它们在硬件接口、读写单元的大小、读写速度上、以及制造成本等都有很大不同。NOR型闪存主要用来存储代码,NAND型闪存则主要用来存储数据。