基于马尔可夫链的期望到达时间距离学习

来源 :南京大学 | 被引量 : 0次 | 上传用户:lizhe_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的高速发展和智能设备的广泛普及,各类图像和文本数据在以前所未有的速度迅速膨胀,基于大数据的各种机器学习应用正在蓬勃发展。围绕机器学习算法中常用的距离度量技术,本文主要做了以下几个工作。第一,传统的马氏距离度量的学习目标是学习一个对称半正定的矩阵,将数据特征投影到新的特征空间之后计算距离,它隐式度量了特征之间的二阶关系,但当数据特征之间存在高阶相关性时,马氏距离度量的效果就不甚理想。本文基于马尔可夫链中期望到达时间的概念,提出了一种新的距离度量方法——期望到达时间距离。它利用了马尔可夫链中状态转移的时间序列关系,隐式度量了特征之间的高阶相关性。第二,在期望到达时间距离度量中,一个合适的概率转移矩阵T对算法性能的影响至关重要。为了从训练数据中利用类别的判别信息自动学习到T,本文提出了基于梯度下降的优化算法LED。之后,为了解决优化算法复杂度过高、训练效率低的缺点,提出了在增量学习的设定下的一种效率优化算法LED-SGD。它利用了学习过程中矩阵低秩更新的特性,极大的降低了算法的复杂度,提高了训练效率。第三,本文在三个图像数据集和两个文本数据集上将期望到达时间度量算法与5个前沿的马氏距离度量算法进行了对比实验,证明了期望到达时间度量算法相对于传统马氏距离度量算法的优越性。同时,在图像与文本数据集上分别进行了可理解性实验,证明了通过LED算法学到的概率转移矩阵T,在一定程度上捕捉到了数据中蕴含的语义信息。
其他文献
本文对断层医学图像插值技术进行了研究。文章利用小波变换可聚集到信号的任意细节的特点,把二维信号分解为高频子图和低频子图,设计出了两种基于小波变换理论的断层图像间匹配
粗糙集理论作为一个处理模糊、不确定性问题的新型数学工具,自上个世纪80年代由波兰数学家Z.Pawlak提出以来,在机器学习、知识获取、模式识别、模糊控制、数据挖掘等领域得到了
随着物联网技术的快速发展和应用,作为物联网技术的枢纽部件物联网网关,其实现技术也被日益重视和迅速发展,物联网网关也因此从功能上得到了不断地完善,从性能上得到了不断地提高
随着医学成像技术迅速发展,使得以此为基础的计算机辅助诊断系统研究成为该领域的热门课题,而医学图像分割是计算机辅助诊断系统中的一个重要组成部分。医学图像分割是医学图像
基于Internet的三维实时图形引擎在三维可视化与虚拟世界领域有着广泛的应用。这些应用随互联网的发展逐渐普及后,人们对虚拟场景复杂度和真实感的要求一直不断超过网络带宽和
本文主要研究了作为IP组播中视频点播服务手段之一的Patching(补丁流)技术,可以怎样灵活运用于应用层组播来提供更好的广域网上的流媒体服务。至今,已有若干应用层组播算法采用
网格被定义为一个广域范围的,无缝的集成和协同计算环境.网格技术可以充分利用资源,为应用和用户提供高性能的服务.目前,在最新的网格标准WSRF中,网格技术与Web service技术已紧密
根据参与决策的agent的行为,多agent决策通常可以分为两类:一类是所有agent之间都没有利益冲突的多agent集体决策;另一类是这些agent之间既有共同利益、又存在竞争关系的多agent
强化学习是一种从与环境交互中学习的机器学习技术,是目前机器学习研究中最活跃的方向之一。强化学习所面临的一个突出问题是大空间和复杂非线性任务带来的“维度灾难”问题。
手机游戏产业的蓬勃发展,使许多游戏爱好者希望能够进入这个领域,成为手机游戏的设计和开发人员。目前,市面上的手机游戏开发工具主要针对专业的程序设计人员,使用它们都需要编写