多层隐类模型的增量学习方法

来源 :云南大学 | 被引量 : 0次 | 上传用户:ghz2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用隐类模型进行聚类分析是一种很重要的方法,它使用隐变量来表示已知的显变量之间的关系,能有效地处理可测数据之间的隐含信息,有很大的实用性目前有许多关于含有隐变量的模型的学习方法,其中多层隐类模型是对传统隐类模型的扩展,可以对所获得的数据进行多维聚类分析,更真实地反映数据之间的内在关系,提高了对数据评估的质量。然而当基于大量的数据来建构多层隐类模型时,存在两个主要问题:一是由于需要引入多个隐变量来代表显变量之间内在的联系,所以在学习时要调用EM算法来对含有缺值数据的网络参数进行估计,从而导致计算复杂度高,消耗时间长;二是由于对模型调整时会生成许多候选模型结构等待评估,从而需要大量的内存空间。因此每次当有新数据被观察到时,如果采用传统的批量学习的方法来将新数据和老数掘合并成一个完整的数据集并以此为基础重新建立模型是不太现实的。针对以上问题,本文将增量学习的方法和多层隐类模型的学习方法结合,提出了一种可以按照新数据逐步调整多层隐类模型结构的算法,主要工作有两点:●首先是确定网络中受到新数据影响的隐结构,以极大似然估计为原则来判断隐结构和数据的拟合度,定义了一个关于模型中隐节点的数据适应度,用来衡量新观察到的数据对模型中隐结构的影响,也有助于压缩存储已经学习的知识。●采用马尔科夫覆盖来划分子网,然后以这些受到影响的隐节点为中心,在个比较小的范围内调整模型结构。在根据新数据所蕴含的知识来调整网络结构时,不仅可以利用以前获得的学习结果,缩短学习时间,而且可以解决因数据集太大、无法全部存储内存时所造成的学习困难。本文的实验验证了算法的可行性,并和传统的多层隐类模型的学习算法做比较,可以看出本文所提出的方法的优势。
其他文献
为了解决各种各样的优化问题,人们提出了许多优化理论,比如梯度下降、牛顿法等经典算法,它们局限于算法本身,要求求解函数必须满足如连续、可微等条件,所以不适用高维度、非线性、
随着互联网应用、电子商务、网络通信的高速发展,其上流动的信息成几何倍数的增长,对我们的生活产生了越来越重要的影响。几乎所有我们想要的信息在上面都能找到,而如何从这些大
当前,基于Android系统的手持移动智能设备的普及度极高,图像压缩编码技术作为Android应用程序开发中的支撑技术,是保证系统正常运行的关键,对其实现算法的选择评估尤为重要。采用
业务规则数量的膨胀和业务规则逻辑的复杂化急需业务规则管理系统提供更多智能化的便于维护规则集的功能。论文对业务规则管理系统进行了研究,在规则集本身和RETE算法两方面取
三维模拟演练系统为企业和应急部门提供了强大的服务,它使用三维平台来提供真实的场景环境,通过模拟重大危险源所发生的事故,来协调各部门之间合作关系并提高参演人员应急处
该文在分析现有驾驶模拟训练系统的基础上,指出训练系统的智能化与个性化以及系统教材的语义共享性是目前驾驶模拟系统急需解决的主要问题.为此,该文提出了一种基于本体的智
随着社会的发展、信息技术的广泛应用,楼宇智能化的概念应运而生。楼宇智能化是借助建筑技术、现代通信技术、计算机技术等,实现楼宇环境的实时监控,对楼宇内的设备进行智能控制
伴随着3G(The 3rd Generation)时代的来临,各种网络技术不断融合,综合智能网技术可以实现PSTN(Public Switched Telephone Network), GSM(Global System for Mobile Communic
用平均场理论研究三子格Ising模型的磁性质,给出自发磁化时,磁矩随温度的变化关系.
Radio frequency is a valuable resource for wireless communication systems. The high-frequency band from 6 GHz up to 100 GHz, where continuous and broad spectra